
德州扑克大赛涉赌案开审,报名费换筹码算赌博吗?
2026年1月14日
围棋是一个有缺陷的游戏吗?围棋的博弈论和纳什均衡
2026年1月14日
余小鲁博士(右)接受专访
余小鲁,是拥有理论物理博士学位之人,更是一位人工智能方面的专家,在美国历经漫长岁月,对各类西方流行的扑克游戏颇为熟悉,从数学、从逻辑学、从小心理学等诸多方面展开系统研究扑克游戏模型,对于扑克人工智能有着别具一格的独到见解,身为新浪扑克学院特邀的讲师 。
答:听闻近日存在为一部分处于金融领域圈子当中的友人讲解德州扑克这一情况,他们最为感兴趣的究竟是哪一方面呢 ?
答:哈哈,若称其为讲解,显然不甚恰当,顶多也就是相互切磋罢了,毕竟大陆民间之中,德州扑克高手数量众多,真可谓是卧虎藏龙。并且金融领域与德州扑克之间,存在着一种很自然的联系,于华尔街处,有不少的交易员转行去从事德州扑克相关之事 ,而从德州扑克领域转行去成为交易员的人同样存在。近期有这么一种传言,说曾是女子德州扑克排名第一的Vanessa Selbst,也打算向华尔街进军 ,而这个Vanessa Selbst,是1984年出生于美国 ,毕业于耶鲁法学院 ,其在职业生涯锦标赛里所获得的总奖金数已然超过了一千万美金 。

著名女牌手 Vanessa Selbst
简洁来讲,金融领域最为关注的便是风险,德州扑克对玩家存在一个重大考验,那就是需长时间维持一种风险中性,亦即 risk neutral 的态度。比如说,你眼前存在两种打法,其一为拥有 20%的几率赢得五千个筹码,其二为拥有百分之百的几率赢得八百个筹码。大脑中固有的风险偏好特征,以使我们相当难以抉择第一种打法。不过恰恰是在大部分的金融市场以及德州牌桌上,若想成为长期成功的玩家,就一定要学会自然而然地选择第一种打法。再去列举一个更为具体些的例子,在河牌圈的时候,面对一个有着30bb的底池,你能够较为自然地去下注20bb从而做出一次诈唬行为。然而要是处于同样的牌以及同样的场面状况下,底池变为300bb,让你全押200bb去做一次诈唬,好多打了十年牌的人,会觉得这极其荒唐且极具冒险性,自己也很少有过这类尝试,又或者说尝试过一两次但失败了,印象非常深刻,接着就摒弃了这种打法。从本质层面来讲,就是大脑当中觉得输掉桌子上残余的200bb筹码所带来的痛苦程度,要远远高于赢得底池300bb所产生的快乐程度。金融市场和德州扑克都是要培养面对风险客观理性的态度。
问:冒昧的问一句,您觉得理论物理跟德州扑克有什么联系么?
答:没什么关联,哈哈,或许跟金融的关联反倒多了一些,华尔街那儿存在着众多物理学博士。理论物理的价值观念是如此这般,追寻源于第一性原理的剖析推理,不进行过多的假定,对于任何一个全新的假定皆秉持着怀疑的态度,不遗余力地去证伪。《自然哲学的数学原理》这部牛顿所著的具有划时代意义的巨著当中,牛顿曾表示“我不做假设(Hypotheses non fingo)”,呵呵,实际上牛顿三定律以及万有引力定律均为牛顿所做出的假设,然而这假设的数量绝对的稀少,几乎能够对整个太阳系的运动实现完美解释 。

清代围棋国手施襄夏
您擅长围棋,我以围棋为例。第一性原理看待围棋,是从围棋的胜负与死活规则着手研究围棋,而非从布局理论定式出发去研究。布局理论定式的威力相当大,然而并非第一性,是从围棋的胜负与死活规则自然演绎而来的。围棋的第一性原理,即气尽棋亡。其直接的推论是,气若不尽,多数情况下要有两个眼。随后便开始研究怎样更易拥有两个眼,怎样围空效率高。极为高超的中国古人围棋理论,其中清代施襄夏的总决开篇首句是,起手据边隅,逸己攻人原在是。该理论旨在阐释围棋布局起手为何下在边角,原因是自身易活,自身易活之地被其占据,对手便不易活,此乃“逸己攻人”。历经三百年,现今处于巅峰状态的阿尔法围棋,依旧是起手据边隅,这便是理论思考具备的力量。紧接着第二句称作入腹争正面,制孤克敌验于斯 。一定要留意,这可不是第一性原理的直接推导结果,所以开始变得模糊起来,紧接着理论开始呈现出“危险”的态势。由于人为设定了一个名为“正面”的概念,那么进入围棋中腹的正面到底是哪一个方向?然而这个理论依旧具备极为强大的威力,顶尖高手的心中都存在正逆向背的相关概念。不过入腹争正面仅仅能够被称作是一个假设,说不定是一个相当出色的假设。
搞理论物理的那种思维方式,是先要去承认,还要深入且透彻地钻研第一性原理,对于其他的任何假设,都秉持着批判的态度。德州扑克的第一性原理能这样来讲:你没办法看到对方手中的底牌,对方同样也看不到你手里的底牌。这话听起来特别像白痴说的,然而要是能够深入并透彻地认识到这一点,那就已然是玩德州扑克的高手了。这是由于这个第一性原理的直接推论,那便是你得承认对手的持牌是一个范围(Range,德州扑克极为重要的一个概念),与此同时承认你的持牌同样是一个范围(并非仅仅是你眼睛所看到的当下持有的两张底牌)。在美国有好多学生跟我讲过这样的话,对手这把牌如此打,肯定手上拿着的是AK,最终翻出来果然是AK,学生满心欢喜。然而这种思维方式极为危险,因为你在不知不觉间做了一个很大胆的假设,即你能够读死对手的持牌,不再是个范围。能够克服跟德州扑克流行相关的林林总总的假设,或者说一些“伪理论”所造成的种种迷思,这主要得益于理论物理的训练,这应该也是至此我战绩还比较不错的一个主要缘由。当然,单从单纯的理论物理的视角来看,兴许还会存着另一种可能,也就是我在牌桌上一直以来运气都相较比较好 。
对余博士而言,最近正从事德州扑克人工智能相关研究,那在此过程中,有产生什么显得格外与众不同的内心体悟呢,嗯?
我对这方面有着长期的关注,你对围棋人工智能有着长期的关注,或许在心情方面是相近似的。由于我自身从事人工智能这个行业,所以可能更多地关注人工智能的技术而非德州扑克了,哈哈。对于这方面的内容,有兴趣的读者能够参考我在新浪近期的一次访谈。
换个问法,以人工智能这个角度来看,您所认为的,德扑AI若要在诸如MTT比赛这般的赛事里,获取到将人类彻底碾压的成绩,应从哪一些方面着手去做呢?
回答是,这属于一个理论性方面的难题,而是并非是只要愿意投入数量多少个CPU,以及数量多少个计算机专家,便能够从当前现有的冷扑程序实现改良而获取到的。原因在于,冷扑所面对的情形是单挑一对一的德州扑克,它的纳什均衡是能够进行求解的,换句话讲,平均每一手牌距离博弈论最优解的差距不到千分之一个大盲注,其完美程度令人感到十分吓人。但是必须要予以注意的是,倘若再多增加一个玩家,也就是三个玩家参与的德州扑克,在数学层面上已经无法确保epsilon收敛至纳什均衡点。关于多人多桌竞赛,在冷扑这个思路方向上进行学术层面的改良,要达成适合多种奖池结构情况下多人参与游戏的那种博弈论分析,是极为困难的。人类现今在多人多桌竞赛里所运用的数学理论自身存在着很大的问题,在当下阶段最多只能称作模型,就像流行的那所谓ICM(Independent Chip Model)独立筹码模型,只是非常粗糙的一级近似。然而这恰恰是德州扑克竞赛最为有趣之处。

多人比赛 是德州扑克人工智能的瓶颈
问:好像不久前去参加了Tom Dwan的见面会,感受如何?
答:十分感激新浪扑克学院给予的邀请,此次见面会真的令我颇为感动,嘻嘻。并非因tom的牌技引发感动德信竞技,他打牌次数着实太多过多了,而是被主办方涵盖新浪扑克学院的一连串安排所动。扑克俱乐部邀tom dwan,就如同高尔夫俱乐部邀泰格伍兹,斯诺克俱乐部邀奥萨利文那般,是极为麻烦复杂的事儿。检验的乃是扑克学院的运营能力,这些远比学习德州扑克牌技要困难得多得多。活动的场地条件布置安排都极为优越出色,然而我觉得这并非最为关键重要的 。来到这次活动很重要,喜欢德州扑克的玩家,其中不少是各行各业里的高手,这次见面会让我结识了许多少见而有意思的新朋友,极为少见。凭借新浪扑克学院的资源背景这类种条件,在大陆德州扑克正蓬勃兴起还处初始阶段,能有很大作为,值得予以期望标点 。

Dwan上海见面会
问:围棋的教学我很明白,但德州扑克究竟如何教?如何学?
答:那就让我借助围棋的譬喻来予以阐释吧。若要进行教导,最为关键的乃是资格,确切而言是对资格具备的信心。设想你身为新浪围棋7段,我认为你至多能够教导新浪围棋6段的学员。假令你的学生是新浪围棋8段,在某个微妙的局势当中他走了错着,你察觉到了并向他作出解释,鉴于在微妙的局势里理由通常也较为微妙,即便他乐意相信你,然而他对你自身的棋力缺乏充足信心,极易产生动摇。此时柯洁针对同样的理由以同样的话语再度向你学生作出解释,你学生顿时就变得极为明晰了。这便是教学所具有的那种微妙的地方。并且德州扑克的情形常常会比围棋显得更加模糊不清,更加微妙难测,要是老师自身的水平没办法给学生充足的信心,就很难发挥出教学的功效。因而我一贯秉持的宗旨是,平时自己去参加报名费为四百美金的赛事,最多只招收参加报名费为两百美金赛事的学生。
至于怎样去学习德州扑克,我仅存在一个要求,那便是纪律性,并并非智商不是年龄不是任何别的因素。比如说有个具体事例,像是我向来对学生有着一项硬性要求,即始终都不要去讲自身被爆冷门的故事。然而有些学生确实没办法做到这一点,在闲聊之际,于听我讲课时,总会时不时地讲自己河牌被对手击中两个outers之类的事儿。针对这些情况,我是持零容忍态度的,当然每个老师都有所不同 。我所理解的德州扑克体系里,任何时刻都不许讲这些故事,由于这于潜意识中对你牌技提升有着极大的负面影响,当然,要是你日后成了极为成功的职业牌手,那时忆苦思甜,讲讲这些故事,关系没多大,但在初学阶段,绝对不行,这便是我最为看重学生的一种品质,纪律性,能克制住不向任何人讲述自己在德州扑克中被爆冷门的故事,于我而言,这个学生就具备成为德州扑克高手的所有条件。
问:打扑克让你印象最深的一件事是?
答:或许每一位身为长期德州扑克玩家的人,都有着各自不同的“顿悟”时刻。我自己记忆最为深刻的那个“顿悟”,并非是在牌桌上领悟到的,哈哈,而是在多年以前学习物理学之际。大家大概都听闻过布朗运动,也就是花粉颗粒于水溶液里持续地进行无规则运动。记得当年我研习布朗运动在数学方面的理论,称作马尔可夫过程,简言之,这种过程必定要具备“无记忆”的特性:下一状态的概率分布仅仅能够由当前状态予以决定,在时间序列当中与先前的历史毫无关联。学到此处,我猛地大吃了一惊,发觉德州扑克比赛乃是一个马尔可夫过程,状态便是你桌子所处得筹码量,比如说我桌子之上此刻存有一万个筹码,这是才由五千个筹码翻倍赢取而来的呢,还是两万个筹码被他人一次糟糕击败输走一半所剩余的呢,在数学层面是绝对不存在区别的,这也就意味着接下来我于这个比赛之中的成绩,仅仅跟我当下拥有一万个筹码这个事实存在关联,跟我怎样拥有这一万个筹码的过往历程并无关系。然而对于人来说,两者的差别那可是天壤之别。人性,虽无法被彻底克服,然而,自此时起,要尽可能使自身如同水中的花粉那般,去进行全然“无记忆”的打牌,。

“无记忆”打牌
(白夜)


