
解析无限德州扑克之范围导向思考(1)
2026年3月19日
香港牌手谈德州扑克:1点比奖金重要,我是欢乐型
2026年3月19日
1月25日,有消息来自网易智能,在本周,于匹兹堡大河赌场,一个名为“Libratus”的机器程序,终于在扑克游戏方面,领先了顶尖人类玩家。
当下,Libratus和人类对手之间的人机扑克大战赛程刚好过去了一半儿,Libratus领先对手将近80万美元的筹码了。按照这样进行下去,最终极有可能是机器赢得这场比赛。

Libratus取得扑克人机大战胜利可谓是人工智能的一项巨大成果,扑克游戏对玩家的推理以及脑筋有着考验,而这在过去一直被视作是机器难以达成的任务,尽管跳棋、象棋、围棋和扑克一样都是棋牌游戏,然而扑克在本质方面与跳棋、象棋或者围棋存在差异,当前跳棋、象棋、围棋这三种都已被AI攻克。
玩家们相互之间,对于对方手里的牌,都是不知悉的,在这样一种“不完全信息博弈”情形之下,若要周全且细致地思索对手有可能使出的各种招数,进而谋划并给出相应的应对策略,是极为艰难的。因为赌注的金额不存在限定,所以无限注德州扑克,格外具备挑战性。

一直以来,扑克已然成为那种AI极难攻克的游戏当中,为数不多的其中之一。百度首席科学家吴恩达Andrew Ng,在之前的时候介绍表明:不存在那种单一的堪称最佳的路数,AI必须要能够随机应变,必须在存在虚张声势这种情况之下,去迷惑对手。
Libratus由卡内基梅隆大学教授托马斯·桑德霍姆开发,托马斯·桑德霍姆来自芬兰,是博弈论与AI专家,他和其博士研究生诺姆·布朗开发了Libratus,他对人类玩家在比赛中能领先AI那么长时间感到惊讶,他说这些专业玩家的确让他震惊,在所有AI染指的游戏中,扑克是目前为止唯一一个AI未能超越人类的游戏。

以针对各种不确定性来寻觅被叫做“均衡”(equilibrium)的最佳策略为目的,AI研究人员借助博弈论。因所有可能性的数量这般繁多,当数量难以计数时,某种“近似”的方法便会被运用。
杜克大学,有一位教授德信竞技,名叫文森特·康尼策,其身教授AI以及博弈论,他讲道,行动的好坏,是由你观察范围之外的事儿来决定的,这同样需要你自己的路数,别人是猜不透的,要是你从来都不虚张声势,那么你就不能算是一个好牌手,博弈论会告诉你,怎样最佳地随机化你的路数。

去年,桑德霍姆曾领导开发了一个AI系统,称“Claudico”,此系统在上一次扑克人机大战里,败给了人类选手。桑德霍姆表明,Libratus经过改进,才达到如今这般的领先。这里面包含一个新的均衡近似技术,还有运用几种新的方法,去对比赛后期阶段可能出现的结果作分析。这种分析极具挑战性,在每一场比赛期间,匹兹堡超级计算中心都在做这些分析。
近些年,机器学习以及AI取得进展,致使一些拥有超人类水平的游戏程序相继涌现。去年,Alphabet旗下子公司DeepMind所开发的AlphaGo,于围棋人机大战里战胜人类冠军。围棋向来以其复杂性闻名,AlphaGo的胜利引发世人关注。

多个专注于扑克的AI开发团队,来自加拿大阿尔伯塔大学的学术团队,来自查尔斯特大学的学术团队,来自捷克布拉格理工大学的学术团队,最近开发了一个名为“DeepStack”的程序,该程序已经在无限注德州扑克比赛中击败了数位专业人类玩家,不过,桑德霍尔姆表示Libratus所面对的人类选手更为强大,赛程也更长,而这会更具统计意义。
得以用来构建扑克机器人的技术,同样能够存在诸多现实世界里的应用。Claudico开发者当中的一个人,山姆·甘茨弗里德(Sam Ganzfried)宣称,博弈论已经被运用于干扰攻击以及网络安全方面的研究,出租车的自动导向,还有机器人规划。

可是,就算Libratus于此次扑克人机大战里取得胜利,那也并不表明人类扑克的终结。多人模式的无限注德扑就没办法被Libratus的技术所掌握,呐。


