第252章 赌徒12 德州扑克
2026年2月16日德州扑克算智力运动还是赌博?在中国开展得规范
2026年2月16日“阿尔法围棋”,两度出手每次都是获胜的情况,其目的在于培养人工智能,使其具备基于复杂信息的决策能力。围棋游戏,一盘之中大约存在10的170次方 个决策点德信竞技,这在所有棋类游戏里是数量最多的。如此情况就需要人工智能,具备极大的计算能力,通过对所有未来步骤的胜率进行预测,进而做出决策。
围棋属于一种“完美信息”博弈,其信息是完全公开的,其中玩家能够看到棋盘上所放置的棋子,并且还能够预测落子的可能性。然而德州扑克玩家手中的底牌是其他玩家所看不到的,所以它属于“不完美信息”博弈,这种博弈要求具备更为复杂的推理能力,对于人工智能而言更具有挑战性。
除此之外,若想在德州扑克这个游戏里玩得好,人工智能必须得懂得一些心理学方面的知识。德州扑克存在着一种经典的策略,那便是诈唬,意思是当手里握着的牌是弱牌的情况下,依旧假装自己手牌很强地去加注,目的是把对手给吓退。对手是不是正在进行诈唬呢?自己在什么时候诈唬才不会被对方识破呢?这些情况都给编写人工智能程序带来了挑战。
德州扑克“人机大战”里,存在人工智能一段不堪回首的往昔,卡内基-梅隆大学所开发的一个较早版本的人工智能“Claudico”,于2015年的那场比赛中输给了人类选手。如此一来,此次卷土重来的“Libratus”凭借什么成功“复仇”呢?
实际上,“Libratus”这个名字暗藏着它胜利的诀窍,该拉丁文词语的意思是“均衡”,这意味着程序所运用的均衡博弈。奥斯卡获奖影片《美丽心灵》主人公的原型约翰·纳什,于20世纪50年代提出“纳什均衡”理论,此理论也被称作非合作博弈均衡,它能确保在同一时间里每个参与者的策略,都是对其他参与人策略的最优反应。
作为“不完美信息”博弈的德州扑克,不能如同下围棋那样,通过计算所有下一步的可能性来进行决策,于是研究人员改进了人工智能的算法,使其应用均衡博弈,依靠平衡风险与收益来决定下一步,从而达到纳什均衡定义里的完美状态,并且研究人员还升级了人工智能的计算能力。
但人工智能于近些年来取得飞速进步,其至关重要的因素却是机器学习技术。开发者声称,他们未曾教导“Libratus”怎样去打扑克,仅仅是向它阐释了扑克的规则,使其借助数万亿次的自我对战探寻出获胜的策略。在比赛日的每一个夜晚,开发者会把它与匹兹堡的超级计算机相连接,以此改进算法,这便是它总能在人类对手对自己形成制衡之前就先行一步的缘由。
在牌桌上赢得顺风顺水之外,掌握博弈论的人工智能,于现实生活里也有着诸多用武之地,像是金融交易,拍卖,政治跟商业谈判,军事或者网络安全策略,还有规划医疗方案等。往后,只要是需要基于“不完美信息”来作出战略决策之时,人工智能都极有可能给出最优解。

