40张图看懂扑克AI与人类30年对抗史，揭秘冷扑大师

德州扑克玩法规则全知道，掌握这些轻松上手

2025年12月30日

一位打了14年职业德州扑克的扑克玩家说

2025年12月30日

Published by dxjj on 2025年12月30日

Tags

2017年，是AI于扑克方面获取突破的年份，冷扑大师Libratus，以及DeepStack，先后完胜于人类，达成对人类专业级玩家的超越，无疑属于里程碑式的突破。在AlphaGo与Master和人类专业棋手的PK光环笼罩下，扑克AI的研究略显黯淡，然而，以解决不完美信息博弈作为目标的扑克AI路径，难度以及重要性并不低于围棋。在商业谈判领域，在医疗健康领域，在网络安全领域，在拍卖等领域，这一技术存在不容忽视的应用价值。依循信息图示这种形式，向你讲述扑克AI的过往经历，阐述其技术方面的原理，描述对战之中的详细情形，介绍AI具有的优势等等，从而知晓冷扑大师从起源到如今的全部情况。

2017年，是AI于扑克方面获取突破的年份，于AI的发展历程当中，有着堪称里程碑的重要意义。

1月，卡耐基梅隆大学的AI程序于“一对一不限注”的扑克比赛里，打败了一组世界级的德州扑克职业选手。所有人都意想不到，这一程序对人类专业扑克手的胜利近乎有压倒性：14bb/h。

德州扑克中，线下以bb/h为衡量标准，一旦超过15bb/h，那就意味着你已完全统治此级别的桌子，若能打到5bb/h至10bb/h的水平，已然相当不错了。线上则是依据bb/100手计算，当超过5bb/100时，已极为厉害了。

那场比赛，总共打了十二万手，最终，AI程序赢到了一百七十万筹码，这一百七十万筹码也就是大约一万七千大盲注，差不多接近九十个数目的买入，就职业扑克玩家而言，幸好这并非实实在在的钱，虽说在这场比赛里他们败得七零八落，团队中的每一个人都输给了那机器。

被称作 Libratus 的这个 AI 程序，其开发者之一，CMU 博士生 Noam Brown 称它为“扑克 AI 的圣杯”，Libratus 是由 Noam Brown 和 CMU 教授 Tuomas Sandholm 共同开发的德信竞技，它仅是 CMU 研发的一系列扑克 AI 程序里最新的那一个，在此之前，从来不存在机器能够在一对一不限注德州扑克游戏里击败世界级的人类职业玩家。

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

来自卡耐基梅隆大学的，开发AI程序Libratus的，名为Tuomas Sandholm的教授（右侧），与名为Noam Brown的博士，。

按照Brown所讲的内容，在Libratus后续的版本当中，其仍然存在着 sizable room for improvement ，并且升级之后的程序在理论层面上能够达成赢 50bb/h的效果。

而在惊人的Libratus之前，有几位来自加拿大和捷克的计算机科学研究者，近日在arXiv上贴出了论文，他们介绍了一种算法，这种算法用于不完美信息，比如说扑克，它叫DeepStack，DeepStack结合使用循环推理来处理信息不对称，它使用分解将计算集中在相关的决策上，并且它还使用一种深度学习技术，这种技术是从单人游戏中自动学习的有关扑克任意状态的直觉形式。有研究者在论文里声称，在一场存在数十名参赛者，且进行了44000手扑克的比赛当中，DeepStack摇身一变，成为了首个于一对一无限注德州扑克赛事里，成功打败职业扑克玩家的计算机程序。

此后，Science采用封面文章之形式，针对此AI于不完美信息博弈里那具备里程碑意义的突破予以了报道。

扑克网站pokersites.me.uk于近日发布了一篇文章，该文章以信息图的方式，完整地介绍了人类开发AI程序用以对抗扑克玩家的历程，自1984年起，我们在这一方向上已探索了30多年，于2017年取得了最值得骄傲的成功。冷扑大师“Libratus”以及DeepStack，其意义不仅在于扑克方面的突破，更多的是深度学习与人工智能综合性的成就以及技术高度。

下文，我们会从多个方面，介绍以扑克为攻克目标的这一人工智能突破路径，这些方面包括历史、技术原理、对战细节、AI的优势、扑克AI的延伸应用以及未来等。在不完美信息博弈上，AI技术的成熟与应用，将会进一步扩展AI的应用边界，例如，在商业谈判、医疗健康、网络安全、拍卖等等领域，AI会得到广泛应用。

对抗人类：机器的崛起

德州扑克训练软件_冷扑大师Libratus与DeepStack_AI在扑克上的突破

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

扑克AI标志着AI研究历史上的又一个里程碑。

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

概述：AI击败人类冠军的三件事

冷扑大师Libratus与DeepStack_AI在扑克上的突破_德州扑克训练软件

人类如何认知AI：人口统计数字

德州扑克训练软件_冷扑大师Libratus与DeepStack_AI在扑克上的突破

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

扑克中反映的通用问题

德州扑克训练软件_冷扑大师Libratus与DeepStack_AI在扑克上的突破

最近10年，驱动扑克AI研究发展的力量

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

扑克AI背后的科学家：

扑克AI的历史，关键时刻

德州扑克训练软件_AI在扑克上的突破_冷扑大师Libratus与DeepStack

1984年，由Mike Caro创建的基础扑克AI软件Orac，参加了WSOP的比赛。

要注意！世界扑克大赛！它简称为WSOP它是世界之上具有重要影响力的扑克锦标赛！它每年都在美国拉斯维加斯举办！可是此项赛事的起源能够追溯至1970年！那个时候奔尼·比尼恩邀请了六位知名扑克选手在马蹄铁赌场举办了第一届比赛！当时的冠军是通过投票选出来的！（来源：维基百科）。

1997年，阿尔伯塔大学，即UoA，发布了扑克AI Loki，该AI专门致力于有限下注的德州扑克比赛。

2003年，扑克AI开发者，开始从国际象棋方法论的模型里转移，去寻找新的办法。

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

2005年，一场扑克机器人世界系列赛，于Golden Palace举办了。

5. 2006年，年度计算机扑克竞赛（ACPC）开始举办。

2008年，UoA的扑克机器人Polaris与6位人类玩家展开了一对一的无限下注竞赛，结果是取得了3次胜利，有2次失败，还有1次平局。

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

7. 2009年，奥克兰大学发布 Sartres 。

2012年，拉斯维加斯地方被称作 Bellagio 的赌场，把启动了用于 2/4 美元有限下注的机器人这件事落实了，在那里每个个体都能够试着去和它展开对抗行为。

9. 在2015年，存在着有限下注的比赛，并且这些比赛被阿尔伯塔大学的扑克机器人Cepheus给攻克了。

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

10. 2016年，于ACPC上出现了两个顶级的AI，其一，是受到前谷歌工程师Eric Jackson开发的Slumbot，它在WSOP上收获了颇为可观的盈利，其二，乃CMU博士生研发的“Act1”，其在数年来的线上扑克对战里始终维持着常胜的态势。

2017年，由阿尔伯塔大学所开发的DeepStack打败了扑克专业玩家，与此同时，来自CMU的神秘AI也将最好的人类扑克玩家彻底完胜。

破解冷扑大师Libratus，这是一款成功瞒过最佳扑克专业玩家的扑克AI ，有对它进行解密的情况。

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

Libratus制定自身扑克策略，是借助匹兹堡超级计算中心，历经1500万小时核心计算得来的。，。

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

匹兹堡超级计算中心的超级计算机“嫁接”资源

德州扑克训练软件_AI在扑克上的突破_冷扑大师Libratus与DeepStack

扑克游戏的特征

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

德州扑克训练软件_AI在扑克上的突破_冷扑大师Libratus与DeepStack

Libratus的策略：

有三大模块的Libratus，其中每一个模块，都在执行着不一样的任务。

了解扑克游戏规则，试着探寻出可应对每一个情景的有着差异的策略。

2. 在每一手牌中，为每一次行动进行决策；

不停地持续更新，针对进入到系统里的每个全新信息切实进行记录，同时还要予以存档。

冷扑与其他AI的不同之处

冷扑大师Libratus与DeepStack_AI在扑克上的突破_德州扑克训练软件

Libratus，它没有运用深度神经网络，是从头开始去学习规则的，并且它所运用的策略是完全独立于人类玩家的。

采用深度神经网络的其他AI，分享旧玩法给人类玩家来学习规则，其运用的策略并非独立于人类玩家。

过渡时期，无限下注德州扑克的解决也不远了

人脑 VS AI

德州扑克训练软件_AI在扑克上的突破_冷扑大师Libratus与DeepStack

Claudico

于2015年的时候，Tuomas Sandholm以及CMU的同事一块儿发布了一个超级智能的扑克AI Claudico，该扑克AI Claudico是用来进行无限注的扑克对抗的。

有四名堪称最佳的玩家，分别是Doug Polk，Bjorn Li，Dong Kim 以及Jason Les，他们在Rivers赌场，完结了同Claudico之间的对抗。

比赛为期13天，期间总共进行了8万手的赛事，下注所涉及的虚拟货币数量，其总额达到了1.7亿美元。

四名玩家一起击败了Claudico，赢了732713美元。

冷扑大师Libratus与DeepStack_AI在扑克上的突破_德州扑克训练软件

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

在2017年的时候，UoA发布了DeepStack，它专门致力于无限下注的德州扑克。DeepStack运用了深度神经网络，目的是去模仿人类于围棋游戏里的“直觉”以及学习能力。DeepStack把游戏的场景“压缩”到10的14次方，这样的话，两个玩家对抗所产生的可能的游戏场景便是10的160次方。

成果：整个研究涵盖几十名参与者，有着44万手的扑克数量。DeepStack的平均获胜比率为450 mbb/g，于专业扑克玩家范畴内，50 mbb/g的赢率便可称作优秀。与DeepStack进行对战的皆是优秀玩家，然而，它尚未同顶级玩家交锋。

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

德州扑克训练软件_冷扑大师Libratus与DeepStack_AI在扑克上的突破

2017年，CMU的冷扑大师Libratus突然出现，达成了扑克AI与人类玩家对抗中，最为具有压倒性优势的胜利。

2017年1月，有四位堪称人类当中最顶级的玩家，和Libratus展开对抗，这场对抗，开展了共计1.2万手的比赛，比赛结束。

在每一次的对抗里面，人类玩家有着2万筹码，AI同样有着2万筹码，而它的盲注是50/100 。

Libratus击败了四位玩家，其赢率是每一手为14.72美元。

Libratus的赢率，是每一百手有14.7 bb，这个结果，对于AI而言，是极为出色优秀的结果呢。

哪四名人类玩家，全输掉了，各自的三万手对抗，这等同于输掉了，一百七十六万六千二百五十美元。

专业扑克手 VS AI扑克手，战役还是战争？

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

AI 的优势在哪？

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

顶级的AI模拟和训练软件，能够帮助人类

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

线上扑克Bot

德州扑克训练软件_冷扑大师Libratus与DeepStack_AI在扑克上的突破

纸牌之外的下一步，AI的未来

冷扑大师Libratus与DeepStack_德州扑克训练软件_AI在扑克上的突破

趋势与可能性

AI在扑克上的突破_德州扑克训练软件_冷扑大师Libratus与DeepStack

AI在扑克上的突破_冷扑大师Libratus与DeepStack_德州扑克训练软件

不完美信息的应用：商业谈判、医疗健康、网络安全、拍卖等等。

参考资料：

冷扑大师Libratus与DeepStack_AI在扑克上的突破_德州扑克训练软件

40张图看懂扑克AI与人类30年对抗史，揭秘冷扑大师

德州扑克玩法规则全知道，掌握这些轻松上手

一位打了14年职业德州扑克的扑克玩家说

德州扑克玩法规则全知道，掌握这些轻松上手

一位打了14年职业德州扑克的扑克玩家说

dxjj

Related posts

北京推出大众扑克赛事 探索全民健身新路径

牌似人生：德州扑克所蕴含的人生道理启示

吴世春谈投资之道：如德州牌局，待人和善方能抓住良机

北京推出大众扑克赛事探索全民健身新路径