
AI首次在多人扑克赛赢人类,德州扑克成就被改写?
2026年2月14日
德州扑克:掌握对抗松凶玩家的方法
2026年2月14日冷扑大师没有使用深度学习,这多少有点风水轮流转的意思。
4月6日,人工智能Liberatus在美国击败人类顶尖德州扑克选手后,接受了创新工场的邀请,它化名“冷扑大师”,要在海南挑战由中国职业德州扑克选手组成的“龙之队”。赛前,在接受新浪科技专访时,开发冷扑大师的卡内基梅隆大学计算机科学学院院长安德鲁·摩尔(Andrew Moore),揭示了在另一场人机大战中,战胜人类背后的基本原理,那就是更加古老的线性规划(Liner Programming)。
解决面对不完整信息去获得最佳策略这一问题时,线性规划早就成了重要方法,在微观经济学领域如此,在商业管理领域同样如此,在这两个领域中,这种算法已大量用于降低生产流程成本,于人工智能领域,其和深度学习火热前的主流即贝叶斯网络技术紧密相关,而贝叶斯网络技术也是目前互联网通用基础技术之一。

2017年1月11日,职业扑克玩家贾森·莱斯(Jason Les)于和Libratus展开德州扑克的对决当中游戏。1月30日德信竞技,卡内基梅隆大学所研发的人工智能在同4名顶尖德州扑克选手之间的赛事里终而得胜结束了对局。
在采访开始之前,摩尔讲道,德州扑克游戏里头有着大量的隐藏信息,从本质上来说它就是一种谈判。而借助人工智能进行谈判实际上乃是卡内基梅隆大学研究团队的初衷。他说道,在扑克游戏中取得胜利会让人觉得人工智能特别了不起,然而他同样满怀期待,期待人工智能能够在协商谈判以及解决问题这些方面出现更多的应用。
以下为部分采访实录,新浪科技整理:
新浪科技称,冷扑大师似乎与AlphaGo存在差异,它并未从人类玩牌的结果里进行学习。那么,德州扑克人工智能跟围棋人工智能究竟有着哪些不同之处呢?
安德鲁·摩尔(以下简称AM)表示,扑克,是个规则极为简单的游戏,然而却存在超多隐藏信息,可围棋不存在隐藏信息,所以,去搞围棋方面的人工智能,就得开展特别深度的棋谱搜索,而弄扑克游戏的人工智能所要面对的问题在于,得把超多的诈唬策略逐个加以考虑了。
新浪科技:冷扑大师有没有使用到神经网络和深度学习技术?
AM,冷扑大师未运用神经网络、深度学习方面的技术,而是采用了最为传统的线性规划,即Liner Programming。
我能够讲得略微细致一点儿。计算机要算出最为合适数量的诈,原因在于不管诈的数量过多,还是过少,都有可能被其他牌手加以利用。数学家约翰·纳什曾经算出一个等式用以解决类似的问题,然而要想切实算出最为合适数量的诈,这个等式或许会存在无数的变量,而我们在冷扑大师身上运用的计算机技术能够得出最接近正确答案的解决办法。
新浪科技:之前曾写下自身玩德州扑克的感受,其表示若想玩好,就得将人性放置一旁。冷扑大师于比赛之际,是凭借算牌,还是运用统计方式去研究对手从而展开心理战呢?
早盘时段:通过算牌这种办法去赢牌才是正确的方式。然而呢,采用这种方式所涉及到的计算数量非常大,冷扑大师要达成其策略,得完成1000万小时的计算才行。
然而,运用统计数据去对对手的玩法展开研究,并非是一种良好的办法,这是由于,一旦我知晓你正在对我的玩法进行统计,那么我就会特意采用变换押注的方法,实际上而言,是能够绕开你的。
于是就如同我之前所讲的那般,冷扑大师不存在运用心理战术去赢牌的想法,仅仅是运用数学方式罢了。
事实上,过去的十年,乃是大数据以及机器学习得以发展的十年。然而,冷扑大师所运用的线性规划,与上述两者存在着极大的差异,它属于达成最优解(Big Optimization)的一项技术,并且相信未来的技术前沿同样是能够实现最优解的技术。

在4月6日,由6位华人牌手所组成的中国龙之队,将会在海南对Libratus发起挑战。不过队长杜悦,也就是位于左四位置的那个人称,龙之队的胜算大概仅有10%。
新浪科技,龙之队比赛的赛制,跟平常多见的多人德州扑克牌局不一样,为何会挑选一对一形式的比赛呢,这是和算法限制有关系吗?
上午时段:在德州扑克里面,最为考验牌手技术的竟然是双人之间的对战,要是存在更多牌手的情境之下,其他牌手相互之间的技术差别反倒会被用来加以利用。
能从新浪科技听闻,除了德州扑克这一项目外,冷扑大师所运用采用的技术,还能够被用在哪些别的不同领域呢?
好的,以下是改写后的句子:在上午时段,我最为钟爱的商业用途,无疑当属商业谈判,借助人工智能,能够达成在最为恰当的时刻,凭借最为合适的价位,寻觅到最为契合的供应商。
谈判是个例子,在非完整信息博弈理论里还挺不错,为啥呢,因为谈判之际,我们不见得会吐露真实想法。研究人员认定,计算机具备与人类或者别的计算机交谈以及谈判的能力相当关键。而计算机的这种能力,就是我们接下来的研究方向。
实则,除却德州扑克之外,同一算法尚可助力诸多亟需器官移植之人,比如说Kidney Exchange。于美国,此算法每年能够协助数百位病患达成肾脏移植的匹配。
新浪科技:所以冷扑大师背后的技术实际上是通用的。
上午:冷扑大师运用的技术的确能够运用至其他领域,以此助力人类寻回已然遗失的信息。举例来讲,购置一套公寓,这便是一番谈判历程。假设我雇请的人类房产中介径直告知卖家我打算出多少价钱买下他的房子,那么我定会马上将他辞退。原因在于其职责乃是于隐匿我信息的状况下,与卖家达成交易。
新浪科技:怎样去看待中国人工智能的市场呢?对于人工智能开发者又有着怎样的建议呢?
上午时段:能够从投资的数量方面看得出,中国人工智能这个市场的发展究竟是何等的繁荣兴荣。这属于极为明智的一种投资,原因在于各个行业的自动化乃是未来经济增长的强大动力。
但是,我觉得一般概念里的人工智能技术工具,其发展前景事实上没多大,唯有能直接用以行业发展的人工智能才有切实的发展前景。我喜爱那些能够把技术运用在现成行业的人工智能初创公司,而非那些研发通用性技术供别的公司使用的企业。
从我的个人角度来讲,倘若你们的初创公司存在能够助力自闭症儿童迅速进行学习的人工智能技术,那么我便会怀有极为强烈的兴趣。然而要是你们的公司拥有可使机器学习更为精准的技术,那就不太妙了。

2015年,在创新工场担任CEO的李开复,于获得卡内基梅隆大学授予的荣誉博士学位之前,和安德鲁·摩尔(右一)拍摄了合影。
新浪科技称,2015年时,卡内基梅隆大学有将近50名科学家,他们陆续被Uber挖走,而且当下人工智能领域顶尖专家加入企业属于目前的趋势,您对于当前的人工智能教育环境是否存在担忧呢?
上午:自2015年1月起始,我们新招录了26名教职员工,仅有4人离去。当下,匹兹堡(卡内基梅隆大学所处之地)已然成为全球的自动驾驶技术中心。科研专家添入企业貌似是个难题,然而这反倒对大学以及匹兹堡皆有益处。
事实上,于担任卡内基梅隆大学计算机科学学院院长以前,我投身于机器学习系统相关方面的工作。虽说我喜爱谷歌的工作,然而我还是决意重新返回卡内基梅隆大学,原因在于当世最顶尖大学所开展的研究工作极为重要,并且会决定21世纪的发展态势。而我所需解决的一个问题是,在人工智能已然实现商业化的世界中,大学能够扮演何种角色。
比如说,在10到15年之前,卡内基梅隆就已然开发出了自动驾驶技术,那么接下来的一步该去做些什么呢?我们并不想始终关注业界一直在做的那些事情,而是想知道能够有哪些具备前瞻性的研究。
对于那些有着想要离开大学想法的教职工,我并非是进行劝留,而是对他们这样去做予以鼓励。实际上,开发冷扑大师的名叫Toumas Sandholm的人已然建立了一家公司,这家公司名为Strategic Machine Inc.。这家公司是从卡内基梅隆大学拆分出来的。大学会把将人工智能应用在扑克上的技术授权给公司,公司接着专注于不完整信息博弈的研发以及商业应用。
针对那些刚刚被录用进来之人,事实上我会予以这般的建言,建议他们在此处开展为期4到5年的研究工作,而后进入业界投身工作3年时间,随后再度折返回来进行5年的研究,这才是理应含有的职业发展历程,并且两者都不会被耽搁。


