两级范围的虚张声势问题
2026年2月10日德州扑克盈利秘籍:做好这5件事,轻松实现盈利
2026年2月10日第一财经日报2017.04.1106:42
AI在德州扑克大战中 掀翻人类
邱智丽
历经五天的激烈战斗,德州扑克人工智能系统Libratus毫无悬念地取得了最终的胜利德信竞技,在这场德州扑克人机大战里,中国龙之队的六位牌手,总共与冷扑大师进行了36000手牌的较量,一共输掉792327分,人工智能完全战胜了人类。
这个比赛的最终结果并非是那种会让人觉得超出意料范围的情况,在这场比赛正式开始之前,创新工场的创立者、担任董事长职位的李开复就曾经做出过这样的表述:“对于人类能够取得胜利这件事持悲观态度,获胜的可能性连百分之十都达不到。”实际上,在今年的1月份,于宾夕法尼亚州的匹兹堡存在的Rivers赌场那里,由CMU研发出来的Libratus人工智能系统已然击败过处于顶级水平的人类职业扑克玩家,那场进行的比赛总共持续了20天的时间,总共玩了数量是12万手的牌局,最终人工智能赢得了金额为176万美元的奖金。
会诈唬的AI
Libratus是个人工智能程序,它玩的是无限德州扑克,其策略并非立足于专业玩家的经验,因而它的玩牌方式或许会有显著的差异,它借助在匹兹堡超级计算机中心大概1500万核心小时的计算,运用算法剖析德州扑克规则,进而构建自身的策略,并且它在比赛里,能凭借预测所有未来步骤的胜率来思索自己的下一步。
和围棋着重体现计算与形式判断能力不一样,德州扑克更注重多人博弈的过程,且要规避人性贪婪等弱点,还要把科学的概率统计与灵活的实战策略巧妙配合妥善。在围棋、象棋等类游戏里,机器跟人类于决策前能够获取全部信息,然而在德州扑克当中,彼此没办法晓得对方的底牌究竟是什么,同样不清楚发牌员发出的下一张牌是啥,在“不完整信息”这种状况下,人工智能得依据经验或者概率统计知识,去揣测对手底牌以及下一张牌的可能性,之后再拟定自身的应对策略。
李开复表示,如果AlphaGo是一个超级天才,那么冷扑大师CMU系统在一定程度上其实是一个EQ专家,是靠EQ来打败你的,表演赛为求降低发牌中的运气因素,机器人采用复式对称发牌,两两成对的牌手中有一人将拿到与配对牌手对打的机器人底牌,所以六名牌手要拆分于两个房间和冷扑大师对阵,比赛过程中还得确保配对牌手相互不能碰面交流。于整个比赛期间,冷扑大师亦常常呈现出某些“怪异”的打法,像是常常超池下注,给对手制造特别大的压力,且做出人类因心理因素无法达成然而却是正确的bluff(诈唬)。
李开复表示,AI运用增强学习技术,于自我对局里学习最优的扑克玩法这件事,是极为关键的一点,而是避开从人类的既定模式当中学习经验。然而,据了解,当前Libratus的算法仅仅适用于无限制投注的一对一比赛。要是把比赛拓展到更为常见的多人制比赛,Libratus所面对的挑战会更大些,还得进行策略方面的升级以及调整。
人工智能应用挑战
就如同马云所提到的那个疑问那般,人工智能战胜了人类围棋大师,那么会打扑克的人工智能,在处理更为繁杂广泛的现实问题之际,又具备怎样的价值呢?在李开复的观点里,世界上很大一部分信息并非是公开的,冷扑大师在遭遇不完全或者误导性信息时所拥有的推理能力,往后能解决在决策、外交、商业合作、谈判这些方面存在的不确定性问题,进而成为人类的“参谋”。
但就像谷歌人工智能在与人类围棋大师的较量中取得大胜,这让AlphaGo的能力得以被充分认识,然而在商业化途径以及能力层面却并非显著。拿AlphaGo来说,它要学习数量极为庞大的棋局才能够掌握有效的下棋技艺,而冷扑大师当下的对战形式是一对一,可在现实生活里德扑是多人游戏,多人游戏在计算方面的复杂程度是当前冷扑大师所难以胜任的。
人工智能借助冷扑大师所提炼出的人工智能技术,怎样去施展其商业价值呢,李开复觉得依旧得满足三个条件,海量的数据,要有标注的数据,单领域存在。比如在金融领域,金融是虚拟的,是由人创造而成的,数据量巨大并且天生就带有标注,像股票的涨停,小额贷款是否还钱,买了保险后人是否出事这样的情况都是一种标注,这就致使AI在放贷、银行、投资、保险这些方面具备潜力。
“相较于向人们告知人工智能能够做的事情,当前更为关键的反而是向人们呈现人工智能不能够做的事情。”地平线机器人技术创始人兼首席执行官余凯曾对第一财经记者讲道,在他的认知里,人工智能进一步拓展时首要面临的挑战便是数据匮乏的问题。众人皆知,人工智能是构建于海量数据之上的,借助大数据开展训练,进而优化算法模型,以人脸识别技术情形而言,训练这一算法模型需要不低于百万级别的图片数据。
当下,人工智能主要采用监督式学习,进行有监督训练就得要有附上标签的数据,所以数据的质量以及精准度跟输出结果紧密关联。“怎样去除数据里的噪音、垃圾信息,从而获取优质且带有标签的数据便成了新挑战,这里面就牵连着无监督式学习或者半监督式学习。”地平线机器人技术联合创始人,算法副总裁黄畅讲道。
另一个大挑战是,深度学习在推广以及场景迁移方面能力欠佳,各个领域的数据都得重新去收集,重新去规范标准,还要再次进行训练,如此一来很难实现跨领域推广。这些挑战同样是人工智能工业界和学术界迫切需要突破的难题。第四范式创始人兼首席执行官戴文渊告知记者,在招聘进程里,懂得深度学习的人数量众多,然而懂得迁移学习、增强学习,并且拥有思辨能力的人特别少。
从实际应用这个层面来讲,人工智能距离完善存在着漫长的路程。就如同李开复于比赛结束之后所做出的回应那般,人工智能已从拥有完美信息的AlphaGo,拓展到了具备不完美信息的冷扑大师,这人机对战基本上不存在什么悬念了,听闻AlphaGo近期就要来到中国和柯洁进行对战,实际上那已然不再具备科学方面的意义了,往后更应当去关注商业范畴的人工智能,在金融、医疗、教育等这些领域之上所产生的商业价值。

