德州扑克被人工智能攻陷，博弈论要走进现实啦

第252章赌徒12 德州扑克

2026年2月16日

德州扑克算智力运动还是赌博？在中国开展得规范

2026年2月16日

Published by dxjj on 2026年2月16日

Tags

“阿尔法围棋”，两度出手每次都是获胜的情况，其目的在于培养人工智能，使其具备基于复杂信息的决策能力。围棋游戏，一盘之中大约存在10的170次方个决策点德信竞技，这在所有棋类游戏里是数量最多的。如此情况就需要人工智能，具备极大的计算能力，通过对所有未来步骤的胜率进行预测，进而做出决策。

围棋属于一种“完美信息”博弈，其信息是完全公开的，其中玩家能够看到棋盘上所放置的棋子，并且还能够预测落子的可能性。然而德州扑克玩家手中的底牌是其他玩家所看不到的，所以它属于“不完美信息”博弈，这种博弈要求具备更为复杂的推理能力，对于人工智能而言更具有挑战性。

除此之外，若想在德州扑克这个游戏里玩得好，人工智能必须得懂得一些心理学方面的知识。德州扑克存在着一种经典的策略，那便是诈唬，意思是当手里握着的牌是弱牌的情况下，依旧假装自己手牌很强地去加注，目的是把对手给吓退。对手是不是正在进行诈唬呢？自己在什么时候诈唬才不会被对方识破呢？这些情况都给编写人工智能程序带来了挑战。

德州扑克“人机大战”里，存在人工智能一段不堪回首的往昔，卡内基－梅隆大学所开发的一个较早版本的人工智能“Claudico”，于2015年的那场比赛中输给了人类选手。如此一来，此次卷土重来的“Libratus”凭借什么成功“复仇”呢？

实际上，“Libratus”这个名字暗藏着它胜利的诀窍，该拉丁文词语的意思是“均衡”，这意味着程序所运用的均衡博弈。奥斯卡获奖影片《美丽心灵》主人公的原型约翰·纳什，于20世纪50年代提出“纳什均衡”理论，此理论也被称作非合作博弈均衡，它能确保在同一时间里每个参与者的策略，都是对其他参与人策略的最优反应。

作为“不完美信息”博弈的德州扑克，不能如同下围棋那样，通过计算所有下一步的可能性来进行决策，于是研究人员改进了人工智能的算法，使其应用均衡博弈，依靠平衡风险与收益来决定下一步，从而达到纳什均衡定义里的完美状态，并且研究人员还升级了人工智能的计算能力。

但人工智能于近些年来取得飞速进步，其至关重要的因素却是机器学习技术。开发者声称，他们未曾教导“Libratus”怎样去打扑克，仅仅是向它阐释了扑克的规则，使其借助数万亿次的自我对战探寻出获胜的策略。在比赛日的每一个夜晚，开发者会把它与匹兹堡的超级计算机相连接，以此改进算法，这便是它总能在人类对手对自己形成制衡之前就先行一步的缘由。

在牌桌上赢得顺风顺水之外，掌握博弈论的人工智能，于现实生活里也有着诸多用武之地，像是金融交易，拍卖，政治跟商业谈判，军事或者网络安全策略，还有规划医疗方案等。往后，只要是需要基于“不完美信息”来作出战略决策之时，人工智能都极有可能给出最优解。

德州扑克被人工智能攻陷，博弈论要走进现实啦

第252章 赌徒12 德州扑克

德州扑克算智力运动还是赌博？在中国开展得规范

第252章 赌徒12 德州扑克

德州扑克算智力运动还是赌博？在中国开展得规范

dxjj

Related posts

北京推出大众扑克赛事 探索全民健身新路径

牌似人生：德州扑克所蕴含的人生道理启示

吴世春谈投资之道：如德州牌局，待人和善方能抓住良机

第252章赌徒12 德州扑克

第252章赌徒12 德州扑克

北京推出大众扑克赛事探索全民健身新路径