科普：博弈论如何将人工智能变身“赌神”

天天德州新手技巧：上桌别急着行动，先把牌看仔细咯

2025年12月26日

德州扑克网游运营方涉罪重审开庭，律师再次进行无罪辩护

2025年12月26日

Published by dxjj on 2025年12月26日

Tags

新华社于北京2月2日发电（记者为彭茜），经过20多天的激烈战斗，4名顶尖德州扑克选手略显落寞，最终还是输了。此次，击败他们的“赌神”是由美国卡内基－梅隆大学所开发的人工智能“Ｌｉｂｒａｔｕｓ”。

每日将近十一小时的比赛完后，人类选手依旧不顾自身疲惫去讨论次日的策略了！不过人工智能好似能够猜透他们的心思呢。每当他们满心欢喜雀跃地发觉人工智能的策略存在漏洞，不曾想到，这一疏漏处到了下一天就已然被填补好了。

这次，美国匹兹堡的一家赌场成了“人机大战”的最新战场，“Ｌｉｂｒａｔｕｓ”在那儿同４名人类选手玩了一对一不限注的德州扑克，共玩了１２万手，比赛从１月１１日开始持续到３０日，结束之际，人工智能领先人类选手，筹码共约１７７万美元。

今年较为早些的时候，研究人工智能“ＤｅｅｐＳｔａｃｋ”的人员来自加拿大艾伯塔大学以及捷克的两所高等院校，该人工智能已在一对一无限注德州扑克里，首次实现击败人类职业玩家的情况。

过去的二十多年间，国际象棋领域，中国象棋范畴，拼字游戏当中，围棋之内，人们怀着复杂的心情，见证了人工智能一步步地攻陷人类智慧的堡垒。然而，又是在棋类方面，又是在牌类事务上，难道人工智能就仅仅只会玩耍吗？

实际上，有益于儿童成长的益智游戏是这样的情况，而棋牌类游戏对于人工智能而言，是助力其“开发智力”的一种方式并非目的，不同的游戏针对人工智能提出了不一样的技术挑战。

“阿尔法围棋”，其两度出手都取得了胜利，它旨在培育人工智能依据复杂信息的决策能力。一盘围棋游戏存在约１０的１７０次方个决策点，这在所有棋类游戏里是数量最多的，它需要具备极大计算能力的人工智能，借助预测所有未来步骤的胜率来进行决策。

围棋属于一种“完美信息”博弈范畴，其信息呈现完全公开的状态，玩家能够清晰看到棋盘之上的棋子，进而据此预测落子的可能性。然而，德州扑克玩家手中所握的底牌，乃是其他玩家无法看到的，所以它属于“不完美信息”博弈类型，这就需要更为复杂的推理能力，对于人工智能而言更具挑战性。

另外，若是想真正玩好德州扑克，人工智能须得懂得一些心理学知识。德州扑克牌游戏里有一种非常经典的策略，那就是诈唬德信竞技，也就是在实际手中握着弱牌的时候，仍然故意虚张声势地去加注，目的是为了惊吓并使对手知难而退打消竞争念头。而对手究竟是不是在进行诈唬之举呢？还有自己选择在什么时候诈唬才不会被对方准确识破察觉呢？诸如此类情况，都给编写人工智能程序造成了不小的挑战难题。

在德州扑克“人机大战”里，存在人工智能一段不堪回首的往昔，即卡内基－梅隆大学所开发的一个相对较早的人工智能版本“Ｃｌａｕｄｉｃｏ”，于2015年的赛事中输给人类选手。那么，此次再度出现的“Ｌｉｂｒａｔｕｓ”凭借什么成功实现“复仇”呢？

其实，“Ｌｉｂｒａｔｕｓ”这个名字，隐含了它胜利的秘诀，那个拉丁文词语，含义是“均衡”，代表着程序所用到的均衡博弈。奥斯卡获奖影片《美丽心灵》的主人公原型，是约翰·纳什，他在２０世纪５０年代，提出“纳什均衡”理论，它又称为非合作博弈均衡，能保证，在同一时间内，每个参与者的策略，是对其他参与人策略的最优反应。

德州扑克属于“不完美信息”博弈，不同于下围棋那样能计算出所有下一步的可能性进而决策，鉴于此，研究人员对人工智能的算法予以改进，使其运用均衡博弈，借由平衡风险与收益来决断下一步，以此达成纳什均衡定义里的完美状况。另外，研究人员还提升了人工智能的计算能力。

近年人工智能进步极快，关键在于机器学习技术。开发者称，他们没教“Ｌｉｂｒａｔｕｓ”打扑克之法，仅告知扑克规则，使其经数万亿次自我对战寻觅获胜策略。比赛日每晚，开发者会将其与匹兹堡超级计算机联网改进算法，此为它总能在人类对手制衡自身前抢先一步的缘由。

赌桌上，人工智能凭借博弈取胜，现实里，比如金融交易、拍卖、政治商业谈判、军事或网络安全策略计划乃至医疗方案规划中，它也占有重要地位，日后，凡要基于“不完美信息”制定战略决策之处，人工智能一般都能给出优选答案。

科普：博弈论如何将人工智能变身“赌神”

天天德州新手技巧：上桌别急着行动，先把牌看仔细咯

德州扑克网游运营方涉罪重审开庭，律师再次进行无罪辩护

天天德州新手技巧：上桌别急着行动，先把牌看仔细咯

德州扑克网游运营方涉罪重审开庭，律师再次进行无罪辩护

dxjj

Related posts

北京推出大众扑克赛事 探索全民健身新路径

牌似人生：德州扑克所蕴含的人生道理启示

吴世春谈投资之道：如德州牌局，待人和善方能抓住良机

北京推出大众扑克赛事探索全民健身新路径