AI在德州扑克中战胜人类，技术交流或成新热点？

两级范围的虚张声势问题

2026年2月10日

德州扑克盈利秘籍：做好这5件事，轻松实现盈利

2026年2月10日

Published by dxjj on 2026年2月10日

Tags

AI在德州扑克大战中掀翻人类

第一财经日报2017.04.1106:42

AI在德州扑克大战中掀翻人类

邱智丽

历经五天的激烈战斗，德州扑克人工智能系统Libratus毫无悬念地取得了最终的胜利德信竞技，在这场德州扑克人机大战里，中国龙之队的六位牌手，总共与冷扑大师进行了36000手牌的较量，一共输掉792327分，人工智能完全战胜了人类。

这个比赛的最终结果并非是那种会让人觉得超出意料范围的情况，在这场比赛正式开始之前，创新工场的创立者、担任董事长职位的李开复就曾经做出过这样的表述：“对于人类能够取得胜利这件事持悲观态度，获胜的可能性连百分之十都达不到。”实际上，在今年的1月份，于宾夕法尼亚州的匹兹堡存在的Rivers赌场那里，由CMU研发出来的Libratus人工智能系统已然击败过处于顶级水平的人类职业扑克玩家，那场进行的比赛总共持续了20天的时间，总共玩了数量是12万手的牌局，最终人工智能赢得了金额为176万美元的奖金。

会诈唬的AI

Libratus是个人工智能程序，它玩的是无限德州扑克，其策略并非立足于专业玩家的经验，因而它的玩牌方式或许会有显著的差异，它借助在匹兹堡超级计算机中心大概1500万核心小时的计算，运用算法剖析德州扑克规则，进而构建自身的策略，并且它在比赛里，能凭借预测所有未来步骤的胜率来思索自己的下一步。

和围棋着重体现计算与形式判断能力不一样，德州扑克更注重多人博弈的过程，且要规避人性贪婪等弱点，还要把科学的概率统计与灵活的实战策略巧妙配合妥善。在围棋、象棋等类游戏里，机器跟人类于决策前能够获取全部信息，然而在德州扑克当中，彼此没办法晓得对方的底牌究竟是什么，同样不清楚发牌员发出的下一张牌是啥，在“不完整信息”这种状况下，人工智能得依据经验或者概率统计知识，去揣测对手底牌以及下一张牌的可能性，之后再拟定自身的应对策略。

李开复表示，如果AlphaGo是一个超级天才，那么冷扑大师CMU系统在一定程度上其实是一个EQ专家，是靠EQ来打败你的，表演赛为求降低发牌中的运气因素，机器人采用复式对称发牌，两两成对的牌手中有一人将拿到与配对牌手对打的机器人底牌，所以六名牌手要拆分于两个房间和冷扑大师对阵，比赛过程中还得确保配对牌手相互不能碰面交流。于整个比赛期间，冷扑大师亦常常呈现出某些“怪异”的打法，像是常常超池下注，给对手制造特别大的压力，且做出人类因心理因素无法达成然而却是正确的bluff（诈唬）。

李开复表示，AI运用增强学习技术，于自我对局里学习最优的扑克玩法这件事，是极为关键的一点，而是避开从人类的既定模式当中学习经验。然而，据了解，当前Libratus的算法仅仅适用于无限制投注的一对一比赛。要是把比赛拓展到更为常见的多人制比赛，Libratus所面对的挑战会更大些，还得进行策略方面的升级以及调整。

人工智能应用挑战

就如同马云所提到的那个疑问那般，人工智能战胜了人类围棋大师，那么会打扑克的人工智能，在处理更为繁杂广泛的现实问题之际，又具备怎样的价值呢？在李开复的观点里，世界上很大一部分信息并非是公开的，冷扑大师在遭遇不完全或者误导性信息时所拥有的推理能力，往后能解决在决策、外交、商业合作、谈判这些方面存在的不确定性问题，进而成为人类的“参谋”。

但就像谷歌人工智能在与人类围棋大师的较量中取得大胜，这让AlphaGo的能力得以被充分认识，然而在商业化途径以及能力层面却并非显著。拿AlphaGo来说，它要学习数量极为庞大的棋局才能够掌握有效的下棋技艺，而冷扑大师当下的对战形式是一对一，可在现实生活里德扑是多人游戏，多人游戏在计算方面的复杂程度是当前冷扑大师所难以胜任的。

人工智能借助冷扑大师所提炼出的人工智能技术，怎样去施展其商业价值呢，李开复觉得依旧得满足三个条件，海量的数据，要有标注的数据，单领域存在。比如在金融领域，金融是虚拟的，是由人创造而成的，数据量巨大并且天生就带有标注，像股票的涨停，小额贷款是否还钱，买了保险后人是否出事这样的情况都是一种标注，这就致使AI在放贷、银行、投资、保险这些方面具备潜力。

“相较于向人们告知人工智能能够做的事情，当前更为关键的反而是向人们呈现人工智能不能够做的事情。”地平线机器人技术创始人兼首席执行官余凯曾对第一财经记者讲道，在他的认知里，人工智能进一步拓展时首要面临的挑战便是数据匮乏的问题。众人皆知，人工智能是构建于海量数据之上的，借助大数据开展训练，进而优化算法模型，以人脸识别技术情形而言，训练这一算法模型需要不低于百万级别的图片数据。

当下，人工智能主要采用监督式学习，进行有监督训练就得要有附上标签的数据，所以数据的质量以及精准度跟输出结果紧密关联。“怎样去除数据里的噪音、垃圾信息，从而获取优质且带有标签的数据便成了新挑战，这里面就牵连着无监督式学习或者半监督式学习。”地平线机器人技术联合创始人，算法副总裁黄畅讲道。

另一个大挑战是，深度学习在推广以及场景迁移方面能力欠佳，各个领域的数据都得重新去收集，重新去规范标准，还要再次进行训练，如此一来很难实现跨领域推广。这些挑战同样是人工智能工业界和学术界迫切需要突破的难题。第四范式创始人兼首席执行官戴文渊告知记者，在招聘进程里，懂得深度学习的人数量众多，然而懂得迁移学习、增强学习，并且拥有思辨能力的人特别少。

从实际应用这个层面来讲，人工智能距离完善存在着漫长的路程。就如同李开复于比赛结束之后所做出的回应那般，人工智能已从拥有完美信息的AlphaGo，拓展到了具备不完美信息的冷扑大师，这人机对战基本上不存在什么悬念了，听闻AlphaGo近期就要来到中国和柯洁进行对战，实际上那已然不再具备科学方面的意义了，往后更应当去关注商业范畴的人工智能，在金融、医疗、教育等这些领域之上所产生的商业价值。

AI在德州扑克中战胜人类，技术交流或成新热点？

两级范围的虚张声势问题

德州扑克盈利秘籍：做好这5件事，轻松实现盈利

两级范围的虚张声势问题

德州扑克盈利秘籍：做好这5件事，轻松实现盈利

dxjj

Related posts

北京推出大众扑克赛事 探索全民健身新路径

牌似人生：德州扑克所蕴含的人生道理启示

吴世春谈投资之道：如德州牌局，待人和善方能抓住良机

北京推出大众扑克赛事探索全民健身新路径