天天德州新手技巧:上桌别急着行动,先把牌看仔细咯
2025年12月26日
德州扑克网游运营方涉罪重审开庭,律师再次进行无罪辩护
2025年12月26日新华社于北京2月2日发电(记者为彭茜),经过20多天的激烈战斗,4名顶尖德州扑克选手略显落寞,最终还是输了。此次,击败他们的“赌神”是由美国卡内基-梅隆大学所开发的人工智能“Libratus”。
每日将近十一小时的比赛完后,人类选手依旧不顾自身疲惫去讨论次日的策略了!不过人工智能好似能够猜透他们的心思呢。每当他们满心欢喜雀跃地发觉人工智能的策略存在漏洞,不曾想到,这一疏漏处到了下一天就已然被填补好了。
这次,美国匹兹堡的一家赌场成了“人机大战”的最新战场,“Libratus”在那儿同4名人类选手玩了一对一不限注的德州扑克,共玩了12万手,比赛从1月11日开始持续到30日,结束之际,人工智能领先人类选手,筹码共约177万美元。
今年较为早些的时候,研究人工智能“DeepStack”的人员来自加拿大艾伯塔大学以及捷克的两所高等院校,该人工智能已在一对一无限注德州扑克里,首次实现击败人类职业玩家 的情况。
过去的二十多年间,国际象棋领域,中国象棋范畴,拼字游戏当中,围棋之内,人们怀着复杂的心情,见证了人工智能一步步地攻陷人类智慧的堡垒 。然而,又是在棋类方面,又是在牌类事务上,难道人工智能就仅仅只会玩耍吗 ?
实际上,有益于儿童成长的益智游戏是这样的情况,而棋牌类游戏对于人工智能而言,是助力其“开发智力”的一种方式并非目的,不同的游戏针对人工智能提出了不一样的技术挑战。
“阿尔法围棋”,其两度出手都取得了胜利,它旨在培育人工智能依据复杂信息的决策能力。一盘围棋游戏存在约10的170次方个决策点,这在所有棋类游戏里是数量最多的,它需要具备极大计算能力的人工智能,借助预测所有未来步骤的胜率来进行决策。
围棋属于一种“完美信息”博弈范畴,其信息呈现完全公开的状态,玩家能够清晰看到棋盘之上的棋子,进而据此预测落子的可能性。然而,德州扑克玩家手中所握的底牌,乃是其他玩家无法看到的,所以它属于“不完美信息”博弈类型,这就需要更为复杂的推理能力,对于人工智能而言更具挑战性。
另外,若是想真正玩好德州扑克,人工智能须得懂得一些心理学知识。德州扑克牌游戏里有一种非常经典的策略,那就是诈唬德信竞技,也就是在实际手中握着弱牌的时候,仍然故意虚张声势地去加注,目的是为了惊吓并使对手知难而退打消竞争念头。而对手究竟是不是在进行诈唬之举呢?还有自己选择在什么时候诈唬才不会被对方准确识破察觉呢?诸如此类情况,都给编写人工智能程序造成了不小的挑战难题。
在德州扑克“人机大战”里,存在人工智能一段不堪回首的往昔,即卡内基-梅隆大学所开发的一个相对较早的人工智能版本“Claudico”,于2015年的赛事中输给人类选手。那么,此次再度出现的“Libratus”凭借什么成功实现“复仇”呢?
其实,“Libratus”这个名字,隐含了它胜利的秘诀,那个拉丁文词语,含义是“均衡”,代表着程序所用到的均衡博弈。奥斯卡获奖影片《美丽心灵》的主人公原型,是约翰·纳什,他在20世纪50年代,提出“纳什均衡”理论,它又称为非合作博弈均衡,能保证,在同一时间内,每个参与者的策略,是对其他参与人策略的最优反应。
德州扑克属于“不完美信息”博弈,不同于下围棋那样能计算出所有下一步的可能性进而决策,鉴于此,研究人员对人工智能的算法予以改进,使其运用均衡博弈,借由平衡风险与收益来决断下一步,以此达成纳什均衡定义里的完美状况。另外,研究人员还提升了人工智能的计算能力。
近年人工智能进步极快,关键在于机器学习技术。开发者称,他们没教“Libratus”打扑克之法,仅告知扑克规则,使其经数万亿次自我对战寻觅获胜策略。比赛日每晚,开发者会将其与匹兹堡超级计算机联网改进算法,此为它总能在人类对手制衡自身前抢先一步的缘由 。
赌桌上,人工智能凭借博弈取胜,现实里,比如金融交易、拍卖、政治商业谈判、军事或网络安全策略计划乃至医疗方案规划中,它也占有重要地位,日后,凡要基于“不完美信息”制定战略决策之处,人工智能一般都能给出优选答案。

