
德州扑克单机版
2026年1月14日
如何在德州扑克中用同花听牌进行诈唬
2026年1月14日
新浪体育新浪体育新闻官方账号2018.01.0807:38



余小鲁博士(右)接受专访
余小鲁为理论物理博士,还是人工智能专家,其在美国待了多年,熟知各类西方流行的扑克游戏,会从数学、逻辑学以及心理学等多个层面进行系统的扑克游戏模型研究,对扑克人工智能有着独特的见解,是新浪扑克学院特邀的讲师。
听说,最近有,为一些金融圈的人,讲德州扑克,他们最感兴趣的,是哪方面 ?
有这样的回答,哈哈,其实不能把它说成是讲解,确切来讲应当是切磋 ,就是因为大陆民间之中德州扑克的高手数量太多了 ,真可谓是卧虎藏龙的状态 。金融圈跟德州扑克存在着一种天然的联系 ,从华尔街从事贸易的人员转行去玩德州扑克的人数众多 ,从玩德州扑克转行去当贸易人员的情况也存在 。最近出现了传言 ,说女子德州扑克排名第一的Vanessa Selbst也有准备进入华尔街的打算 ,他是84年出生的 ,毕业于耶鲁法学院 ,在其职业生涯锦标赛里总的奖金超过了一千万美金 。
往简单方面说,金融领域最为关注的便是风险。德州扑克给予玩家的一项重大考验,在于需长时间维持一种风险呈中性(risk neutral)的态度。试举一例,你眼前存在两种打法,其一为拥有20%比率赢得五千个筹码的机会,其二为拥有百分百比率赢得八百个筹码的机会。大脑中固有的那种风险偏好,致使我们很难抉择第一种打法。然而恰恰在绝大多度数的金融市场跟德州牌桌上,若要成为长期的成功玩家,必定得学会自然而然地选择第一种打法。举个更具体些的例子,在河牌圈,面对一个有着30bb大小的底池,人就能够很自然地去下注20bb来实施一次诈唬;而当其是同样的牌、同样的局面,但底池变为300bb时,要让人全押200bb去诈唬,许多打了十年扑克牌的人,会觉得这既荒唐又冒险,自己也极少去进行尝试,或者就算尝试过一两次且呈失败状态,印象深刻难忘,随后便舍弃了这种打法;从本质上来看,就是大脑内认为输掉桌上剩余的200bb筹码所带来的苦痛程度,要远大于赢到底池300bb所收获的快乐程度。金融市场和德州扑克都是要培养面对风险客观理性的态度。
问:冒昧的问一句,您觉得理论物理跟德州扑克有什么联系么?
答:没什么关联,哈哈,或许跟金融方面的联系反倒显得更为突出一些,在华尔街那可是存在众多物理学家博士呢。理论物理所秉持的价值观是如此这般,致力于追寻源自第一性原理起始的分析推导过程,不会进行过多的假定,对每一个全新的假设都始终怀揣着质疑的心态,想尽各种办法去予以证伪。牛顿在其那部具有划世代意义的巨著《自然哲学的数学原理》当中表示,“我不做假设(Hypotheses non fingo)”,呵呵,实际上牛顿所提出的三定律以及万有引力定律全都是牛顿自己做出的假设,然而这个假设数量绝对的少,几乎是以一种完美的状态解释了整个太阳系的运动情况。
您身为围棋高手,我以围棋事例来说。对于围棋施以第一性原理,那便是从围棋的胜负准则以及死活准则着手去钻研围棋,并非从布局理论定式开启对此的研究。布局理论定式这些所具备的威力相当巨大,然而并非是第一性的,乃是从围棋的胜负准则以及死活准则自然而然演绎推导出来的。围棋的第一性原理,即为气尽棋亡。其得出的直接推论,就是气若不会尽,多数情形下要有两只眼。接着便开始探究怎样容易拥有两只眼,还有怎样围空效率更高 。中国古代之人的围棋理论极为高超,清朝时期施襄夏所著总决开篇的头一句,起手要依据边上角落的位置,让自己安逸同时攻击他人原本就在此理。这个理论用来阐释围棋布局起手为何是下在边角之上,原因在于自身容易获取存活(处于安逸)情形,容易存活的地方被己方占据后对手就难以存活,这就叫做“逸己攻人”,历经了三百年,如今创造出高超极致水平的阿尔法围棋,依旧是起手依据边上角落的位置,这便是理论思考所具备的力量。紧接着第二局话说的是深入棋盘中部较量就要争取占据正面关键位置,制服对方孤立棋子以便战胜敌人在此可得到验证。必须留意,这已并非第一性原理的直接推导结果了,所以开端变得模糊,理论开端变得“危险”起来。因为人为设定了一个概念称作“正面”,进入围棋中腹的正面到底是哪一面呢?然而这个理论仍然威力极其强大,顶尖高手心里都存有正逆向背的概念。但入腹争正面仅能够被称作一个假定,或许是一个相当不错的假定。
理论物理其所具备的思维模式,是要先去予以承认,并且透辟钻研第一性原理,对于除此以外的任何假设均是抱持着批判的那种态度。德州扑克的第一性原理能够以这样的方式来进行表述:你没法看到对方手上拿着的底牌,对方同样也看不到你手中握着的底牌。听起来似乎甚是愚钝白痴,可要是能够透切认识到这一点,那就已然属于德州扑克的高手范畴了。因为基于这个第一性原理所做出的直接推论,便是你不得不承认对手所持有的牌乃一个范围(范围,此为德州扑克里极具重要性的一方面内容),与此同时,又得承认你自己手上所持之牌同样也是一个范围(此范围并非仅仅局限于你此刻眼睛所看到的自己目前正拿着的那两张底牌)。于美国而言,众多学生朝着我这般表述,对手于这一局牌采取如此打法,定然手上握着的是AK,后续翻牌的结果果真亦是AK,学生从而满心欢喜。然而,这样一种思维模式着实极为危险,缘由在于你在不知不觉之间已然做下了一个相当大胆的假定,即你能够确切知晓对手手里的牌,不再是一个范围了。对于理论物理的训练,其主要作用在于使我能够去克服各种各样,和德州扑克流行程度相关的假设,或者可以换句话来说,是去克服种种“伪理论”带来的迷思,这应当算是到目前为止,我已有战绩还算不错的一个主要缘由。当然,要是从纯粹理论物理的角度出发来看,也不能将另一种可能给排除掉,那就是在牌桌上,我一直以来运气都比较良好。
问,余博士近来正钻研德州扑克人工智能相关事宜,可有什么与众不同的心得体会呀?
答:我于这方面有着长期关注,和你对围棋人工智能有着长期关注,或许心情方面是大致相同的。只因我自身从事人工智能这个行业,可能更多关注人工智能的技术而非德州扑克了,哈哈。关于这方面的内容,有兴趣的读者能够参考我在新浪近期的一次访谈。
相关阅读:德州扑克被AI攻破? 刚进行到围棋九路盘而已
答:就人工智能这个角度而言,您认为德扑 AI好想在诸如 MTT 挑战赛里获取碾压人类的相应成绩之时,理所当然应当从哪一些方面着手呢?
这是一个特别难的理论性问题,不是说投入好多CPU,好多计算机专家,就能够从当前的冷扑程序来进行改良得到想要的结果,尽管这是单挑一对一的德州扑克,它的纳什均衡是能够求解的。就是说平均每手牌距离博弈论最优解还占比大盲注不到千分之一很吓人的!但是要注意,一旦再多一个玩家,变成三个玩家的德州扑克这事在数学上就没办法保证epsilon收敛到纳什均衡了。在多人多桌锦标赛方面,学术层面需按照能适合多种奖池结构多人游戏博弈论分析的要求,于冷扑这个思路里进行改良,这极大地困难。人类现阶段在多人多桌锦标赛中所运用的数学理论自身存在很大问题,在当下阶段顶多被称作模型,如流行的ICM独立筹码模型,属于超级粗糙的一级近似。然而这恰好是德州扑克锦标赛最为有趣之处。
问:好像不久前去参加了Tom Dwan的见面会,感受如何?
答,着实万分感谢,源自新浪扑克学院之所发出的邀请,于此番见面会时,令得我内心满是感动之意,哈哈。此种感动却不是因其,tom精湛的牌技,毕竟一直太多观看tom打牌之举已然发生,实乃促使引发感动之情的,乃是主办方,其中更是将新浪扑克学院涵盖予以的一系列妥善安排。扑克俱乐部去邀请tom dwan,这就好比高尔夫俱乐部,对泰格伍兹进行邀请,斯诺克俱乐部,对奥萨利文予以邀请一样,全然皆是极为麻烦的状况。这实际所考验的,乃是扑克学院运行过程之中的能力水准,而这些方面,远比学习那德州扑克牌技需要克服的困难更多。此次活动期间,各种场地条件的安排,都呈现出极为优越的态势,然而我觉得,这当然并非是最为关键重要的情况。对于喜欢德州扑克的玩家来讲,重要的是来参与这次活动,好多这样的玩家都是来自各个行业的高手,在这次见面会上便能使我结识好些极具趣味性的新朋友,可太难得啦。依仗新浪扑克学院的资源背景等诸多条件,在大陆德州扑克正蓬勃兴起的当下此阶段,会有不凡成就,很值得去满怀期待 。
问:围棋的教学我很明白,但德州扑克究竟如何教?如何学?
那么就让我借助围棋的比方来予以阐释。在进行教学这个行为时,尤为关键的是所谓的资格,如果确切地说呢就是对于这资格所孕生出的那份信心。打比方你身为新浪围棋7段,如果让我去评判的话德信竞技,我觉着你于传授知识这件事上,最多能够教导新浪围棋6段的徒儿们学习。咱们先假定,你的那位学生是新浪围棋8段,在一种存在着微妙之处的棋局态势里,他行进得方向有误,你敏锐察觉并向他说明个中缘由,鉴于该微妙态势期间,缘由多数时候也蛮微妙的,所以当即便他内心愿意去信赖你,只是由于对你自身所具备的棋力,并未持有充足无比的信心,故而很轻易就会摇摆不定。就在此刻,柯洁,针对同样的情形,使用相同的言语同样向你的学生解释了一回,然后,你的学生就变得对于整个状况相当清晰明了了 。这便是教学所呈现出的那种微妙之处,并且德州扑克的局面常常会比围棋显得更为模糊,更为微妙,要是老师其自身的水平没有办法给学生充足的信心,那么就很难发挥出教学的作用,所以我一贯秉持的宗旨就是,平日里自己参与报名费为四百美金的比赛,最多只招收参与报名费为两百美金比赛的学生 。
关于怎样去学习德州扑克,我仅存在一个要求,那便是纪律性,并非智商,亦非年龄,更不是任何别的因素。比如说,我向来对于学生有着一项硬性要求,那就是绝对不可以讲自身被爆冷门的故事。可是有些学生的确没办法做到这一点,在闲聊之际,或者听我讲课时,总会时不时提及自己河牌时被对手击中两个外开牌之类的事儿。针对这些情况,我是持零容忍态度的,当然啦,每个老师都有所不同。于我对德州扑克理解所构建的体系里,任何时刻都不能够去讲述那些故事,由于这于潜意识层面会对你牌技的提升拥有极大的负面作用。当然了,要是你往后变成了极为成功的职业牌手,在那个时分忆苦思甜,是能够讲讲这些故事的,影响不大,然而在初学阶段,绝对不可以。这便是我最为看重学生的一种品质,纪律性。能够克制住不向任何人讲述自身在德州扑克中遭遇爆冷门的事,于我而言,这个学生便具备了成为德州扑克高手的所有条件。
问:打扑克让你印象最深的一件事是?
答:或许每一名历经很长时间的德州扑克玩家而言呵,都有着各自不一样的“有觉醒的猛然领悟”片刻哩耶。我身上留给自己印象最为深刻的“有觉醒的猛然领悟”,并非是在心痒痒一直想去畅玩的牌桌上获得感悟的,嘿嘿嘻,却乃是在许多好多好多年之前去学习物理学其间呐哇嘛的。众人们或许全都听闻过所谓布朗运动一回哩哈呀哒嘎嘿咯哒呀嗨嘿,也就是漂浮于水中的花粉碎屑一小粒一小粒的不断在里头频繁做着毫无规则性且杂乱又复杂运动喽嚯呀。还清楚记得好多年前自己学习布朗运动在数学领域里所涉及的理论哇耶,名称是被叫做马尔可夫某种状态持续,简单来讲哇,这样的某状态持续必须得具备“没有任何记忆关联”这样的性质哒啦哟:紧接着的下一个状态出现的可能性分布,仅仅只能够凭借当前所处状态来决定哇,在按照时间先后次序排列下来一串中跟先前早就留存过往没有任何关系噻哒嘶!走到这儿,我猛地被惊了一下,发觉德州扑克竞赛乃是一个马尔可夫进程,状况便是你桌上的筹码总数。就像我桌上此刻有一万个筹码,它是起始由五千个筹码翻倍赢取而来的,亦或是原本两万个筹码被他人一次糟糕牌局输了一半后剩余的,在数学层面是绝对不存在差异的,换句话讲接下来我于这场竞赛里的表现,仅仅跟我当下拥有一万个筹码这个情形有关联,跟我怎样获取这一万个筹码的过往历程并无关系。然而对于人而言,这两者之间的差别犹如天壤之别。人性尽管是不能够全然克服的,然而从这个时刻起,就要尽可能地使自身犹如水中的花粉那般,去进行全然“无记忆”的打牌游戏 。
(白夜)


