
德州扑克:一场精彩的竞技扑克盛宴
2026年1月3日
德州扑克概率表全了,快来看看各种情况的获胜几率
2026年1月3日
线上德州扑克面临严峻考验
几周前,谷歌宣称他们的人工智能围棋,这般存在,以5比0的比分,战胜了那三届欧洲冠军樊麾职业二段。围棋,它可是一种极难被电脑攻克的棋类游戏,所以,当看到一个实力强劲的棋手被AlphaGo打败之际,我们究竟是应该庆贺,还是应该震惊,又或者是两者都有。对于扑克玩家而言,说不定会担心面对扑克人工智能时将会败下阵来。
什么是Go?
Go这个用语,是那世界上最为古老的棋盘游戏,也就是围棋的英文名字,围棋它起源于中国,在日本,也就是被称作igo的地方同样流行,在韩国,也就是被称作Baduk的地方也流行。两个人,轮流着在棋盘之上落子,其中一个使用黑棋,另一个使用白棋。目标在于围住对方的棋子,当对方的棋子被完全围住之际,就被抓获。游戏结束的时候,通过比较双方占领棋盘的面积来分出胜负 。

围棋规则极为简单,其简单程度远超其他抽象的策略类游戏,然而其含义却相当复杂。对于电脑而言,难度源自游戏空间的规模。国际象棋具备固定的初始设定,围棋则不然;所以国际象棋仅能采用8*8的棋盘,围棋却能够在不改变规则的情形下随意调整棋盘大小。现今正式投入使用的围棋盘是19*19,以往也曾经使用过17*17的棋盘。也许未来的某一天会考虑采用21*21的棋盘,当原有的19*19棋盘无法满足职业水准的时候。
围棋的棋盘较大,这表明相较于国际象棋,围棋每走动一步棋,都存在着更多的落子选择可能性,鉴于每一步棋都大概拥有上百种选择情况,所以这是无法依靠蛮力去解决的,这种状况让围棋对于人工智能而言,成为了一项饶有趣味的挑战。
无上限德州扑克,另一个困难的游戏
扑克牌跟围棋相同,对于电脑来讲极难攻克,阿尔伯塔大学的迈克尔·鲍林教授以及同事针对有上限德州扑克实施了“弱解决”,他们能够知晓在起始状况下,怎样能够确保必定不会失败,然而人类依旧能够在无上限德州扑克中战胜人工智能。
假如你想弄清楚为何呈现这般状况,那你就得知晓扑克游戏里每个瞬间的变量。于有上限德州扑克之中,动作向来不会超出三个:于开牌之前能够抉择跟牌或者下注,当面临跟注之际能够抉择弃牌、跟牌或者加注。然而在无上限德州扑克里,下注的额度能够从最小值一直到全压。人脑能够把思考游戏的步骤予以简化,存在几个标准的赌注大小(不管是百叶窗或者百分比),但是当前的人工智能却需要针对每一条街(德州扑克术语)分别去思索该作怎样的下注,而并非将其视作一个整体的操作。
另外,鉴于扑克属于一种存在不完善信息状况的游戏,无上限德州扑克在加注这一行为上,于次数以及数量方面均不存在限制。当任何额度的下注行为能够被准许成立以后,此时扑克游戏所蕴含的极限情景出现爆炸式变化,进而致使无上限扑克蜕变成超出围棋一个层级的“更大”的游戏。
神经网络与机器学习
此处在人工智能方面,从字面意义来讲,更侧重于“智能”这一方面,并非是去研发专门的算法用以解决特定的问题。神经网络的研究尝试去模拟人类大脑的低级别操作,期望有朝一日能够训练出这样的程序,使其能够执行任何给定的任务。
再一次进行重申,细节并非是极为重要的,除非这属于你感兴趣的领域范畴,然而有那么几件事情是你需要去了解知晓的。首先,那个算法在最开始的时候并不“清楚”该如何去做任何任何的事情,不过它能够对自身在某些方面存在的局限性予以纠正。它需要在一些较为便利的格式之中进行输入,并且初步产生随机性质的输出。接着,它所具有的输入数据(举例来说,像是围棋棋谱记录或者扑克记录之类的),随后会有输出(好比判断谁赢得了游戏等等之类的)。然后将其输出与输出目标进行比较,并且对其内部参数做出调整,尝试想办法把两者紧密地联系到一起。历经好多好多回的迭代之后,其输出开端愈发紧密地与所需的解决方案相匹配。恰似一个处于成长进程中的孩子犯了错,获取老师以及父母的反馈,进而逐渐改正错误 。
其次,存在这样一个有点令人担忧的事实,这些学习算法一旦被训练成功,其创造者可能并不清楚它们是怎样工作的。他们能够理解学习过程本身,然而最终的决策却是以涉及整个网络的整体方式进行的。想要通过检查低级别的代码去了解它的“逻辑”,这是毫无意义的,这就好比是试图通过一个单一的神经元去解读人的大脑。这是近期阻碍神经网络进展的原因当中的一个。当人工智能的工作成果不尽如人意时,它几乎没办法告诉你错误究竟出在什么地方。
组合方法
神经网络存在大弱点,在于其有那个所谓的一般原则,也就是在网络中,若倾向广度,那么深度就会被牺牲掉,反过来讲,倘若倾向深度,宽度必遭受牺牲,这是其一。其二呢,除了调试当中会涉及那颇具难度的情况外,神经网络还有这样的状况。其三德信竞技,一个通用的解决办法很难变为最优的方案。其四,虽然神经网络在任何挑战里都能够得以应用,然而具体的问题运用手工算法会获得更好的解决结果。
就任何给定的问题来看,一个专门的算法理应比一个 神经网络的表现更优。然而写这样的算法,要求程序员在理论方面知晓怎样解决此问题。可是,在谈及人类直觉的问题之际,我们对大脑的探索极为有限:当职业棋手无法预见到最终的场面时,那他究竟是怎样判断出自己已然赢了呢?只能说这是一种所谓的“经验”。
致使AlphaGo这般令人难以相信地强大的,正是混合的方法。其核心是一种类型树搜索算法,该算法借由蛮力穷举呈现出所有可能的下法。然而,以往的人工智能在每一种可能的下法上均耗费相同的时间,或者依赖明确的、人类编码的启发去告知它们前往何处寻觅。而AlphaGo拥有两个神经网络,其中一个依据它学过的基本策略为它提供建议,另一个神经网络则会借助借鉴历史对局来告诉AlphaGo在何处落子能够赢得比赛。在这两种神经网络相结合的状况下,这些引导它借助游戏树,并且确保它更多地耗费处理器功率,从而更深入地读取最具前途的分支。
完善VS不完善信息:不同的技术
这个对比或许并非极为精准,原因在于围棋与扑克之间存有一个根本差异,即围棋不存在概率以及隐藏信息方面的问题,然而扑克却存在两种因素,也就是随机的底牌与未知的对手手牌,这致使这两个游戏在解决问题之际会运用截然不同的方法,在完善信息游戏里完美的策略是“绝对”,就像围棋那样。
这意味着,从理论层面来讲,围棋的每一个局面之下,都存在着一个正解,你的对手能够接收到与你相同的信息。在不完善信息的游戏当中,完美的策略是典型的那种“混合”情况,就像扑克那样。这意味着牌手会在几种不同的选择里面,对概率进行权衡。比如说,在一个给定的情形之下,机器给出的理想策略是,弃牌所占的比例为30%,加注所占的比例为70%。一定量的不可预测性是必不可少的,目的在于避免向对手传达信息。
在人类进行分析时,不完善信息的游戏一般会运用源于经济学一个分支的传统博弈论。另一方面,完善信息的游戏,我们更倾向于采用属于数学一个分支的组合博弈论。这里涉及一种名为“超现实”的事物,它仅适用于信息完善的游戏,且不包含随机性或不确定性。
同样,人工智能研究领域始终被划分成不一样的类别,像围棋以及扑克。这些阵营里的每一个都存有自身的技术,形形色色的树搜索适宜于完备信息游戏;极大极小或者遗憾最小化适宜于策略和隐匿信息的游戏。要是你并非一名人工智能研究人员,那就没必要知晓这些术语的含义是什么,你只需明白它们是全然不同的,而且针对某一类游戏的技术通常不适用于别的类。
对德州扑克的威胁
倘若神经网络足以应用于任何问题,并且AlphaGo已然证明它们能够有效地结合更具专业性的算法,那么不存在理由去不相信我们将会目睹“神经复杂化”的扑克人工智能。
首先,当下最为出色的扑克人工智能,仅能够单独地处理每一副牌,并非去顺应对手的打法以及习惯。一个神经杂化的扑克人工智能,能够被应用于整场比赛,并非仅针对个人的操作予以分析。如此一来,这个扑克人工智能可对水平欠佳的玩家实施诈唬,而对水平较高的玩家运用更为平衡的策略,恰似一名真正的顶级牌手似的。
比传统的GTO机器人能带来更大收益的,是神经杂化的人工智能,这是明显能看出来的事实。除此之外,使用这种机器人更危险的地方在于,极难被发现。当前多数机器人存在弱点,它们从不调整,从不感到疲惫、心烦意乱,也不具有侵略性。扑克网站能靠数据统计以及对牌手倾向分析,找出有问题的玩家,然而要是一个机器人能依据对手做出调整,想要找到它的破绽就变得十分困难。
哪怕是当下,种种迹象显示,扑克网站正处在检测机器人的状态中。去年,有个俄罗斯奥马哈机器人,在PokerStar(美国极为流行的线上扑克网站)上网玩、作弊,却没被发觉,一直到某一天,有个玩家在给自己的记录做统计之际,才察觉到了这个异样情况。如今,该网站已然开始要求特定的某些玩家,在比赛期间录制自身操作的视频,目的是用来证明他们未曾使用机器人助手。这同样表明,就算存在怀疑,安全小组也不容易判定究竟有没有作弊 。
首先,我要表明,我所指出的内容并非是针对PokerStar,而是意在说明,鉴于其身为世界上规模最为庞大的扑克网站,你所能期望的便是他们配备最为优秀的安保人员;一旦连这样的网站都陷入困境,你能够想象得出其他扑克网站会是怎样的状况。其次,如果在未来,每一个人都企图借助神经杂化的人工智能去参与线上扑克游戏,那么你便没有办法缉捉到作弊之人了。
AlphaGo vs 李世石
对于AlphaGo实力的知悉,仅仅局限于去年10月,AlphaGo与樊麾进行的五番棋。樊麾,有着“三届欧洲冠军”之称,听起来着实相当厉害。然而,围棋在亚洲以外的国度并非那般流行,并且所有顶级棋手都汇聚于三个国家:中国、日本以及韩国。战胜樊麾,恰似战胜芬兰国家篮球队那般,能够确定的是,这的确是一项令人记忆深刻的壮举,可这绝对不表明你可以与NBA级别的篮球队相抗衡。
下月,AlphaGo会迎来真正的考验,那是与韩国传奇李世石九段的五番棋对决,获胜一方能拿到一百万美元奖金,也如预料那般,计算机界对AlphaGo保持乐观,然而棋手觉得李世石起码在未来一到两年内不会被人工智能击败。
不幸的是,评估alphago真正的力量存在一定难度,因为它并非致力于摧毁对手,而是尽力使自身获胜概率达到最大化。有时,在与樊麾对决时,它看似较为保守,然而它依旧以5比0的成绩零封对手;这如同表明樊麾的表现未能激发AlphaGo的真正实力。所以这使我产生了些许犹豫,不过截至目前,我依旧谨慎地看好李世石能够取胜。有一件事情是确定无疑的,那就是无论最终结果怎样变化,我都会对其进行持续关注。要是你也对扑克的未来怀有担忧之情,你同样应该关注这件事情。
(原载PtP 文森特译)


