100:0战胜AlphaGo。 AlphaGo Zero让人类连对手的资格都没有了？

玩德州扑克竟能学到这17条加密货币投资经验，快来看看

2026年1月14日

人工智能技术在棋牌游戏《Pluribus》中的应用及其现实意义

2026年1月14日

Published by dxjj on 2026年1月14日

Tags

制作：缪子文化王轩

监制：中国科学院计算机网络信息中心

谷歌子公司DeepMind于2017年10月19日，发布了AlphaGo的新版本。许多人晓得AlpoaGo是一个人工智能程序，可却不清楚它实际上乃一个家族。曾战胜韩国选手李世石的那个AlphaGo Lee属于此家族。在乌镇打败世界冠军柯洁的那个AlphaGo Master同样属于此家族。此次发布的是AlphaGo Zero，它历经3天的训练，就凭借100：0的战果折服了其兄长AlphoGo Lee，又历经40天的训练，进而战胜了它的另一位兄长AlphoGo Master 。

德州扑克是梭哈吗_德州扑克27定律是什么_胡莱德州扑克是赌博吗

AlphaGo Zero最大特点

本次所发布的AlphaGo Zero与先前的版本相比较而言，其中存在的最大区别之处在于，它并非再去依仗人类的指导从而实现成长，也就是说，之前的AlphaGo Lee是依靠人工进行录入的数量众多的棋谱德信竞技，以此来辅助它学习怎样下棋，简单来讲，它是在人的指引下开展学习的，能够理解为是由人类历经千年的围棋经验所培育出来的学生。

而AlphaGo Zero运用了强化学习算法，也就是不再依靠任何棋谱，在编程人员输入围棋基本规则后，不再予以任何教导，完全让其自身去摸索，总结走棋的方法，这等同于人工智能完全以自身的方式来学习。AlphaGo Lee惨败于摒弃了人类经验的AlphaGo Zero，这表明人类的经验或许误导了AlphaGo Lee，进而对它的发展形成了限制。

在AlphaGo Zero的行棋方式里，于开局阶段时，和人类选手有着较大的相似之处，在收官阶段，同样与人类选手有较大相似之处，然而，盘中的行棋风格，确实与人类选手以及之前版本的AlPhaGo存在较大不同，而恰恰是这种不同，使得它能够在与AlphaGo Lee的100次交战中处于不败之地，换个表述来讲，如果当初AlphaGo Lee不是拜人类为师，而是向机器学习，那么对于具备更强计算能力的AlphaGo Lee而言，胜负究竟如何还难以知晓。

AlphaGo Zero除了零经验学习外，还有一大特点，是把之前版本AlphaGo的两个神经网络融合在一起，在之前版本的AlphaGo里，如何走棋是通过“策略网络”和“价值网络”这两个神经网络来计算的，也就是先由“策略网络”凭借之前积累的经验，判断在当前棋型下哪些位置适合行棋，然后由“价值网络”对在这些位置行棋后的各种可能进行模拟，计算胜率，最后选择出行棋位置。

而AlphaGo Zero把二者融合成了一体，针对之前两个网络的特征提取等模块予以了共用，能够在计算出有可能行棋的位置之际就给出相应的“胜率”，极大地提升了效率，削减了训练所需要的时间。这也是AlphaGo Zero于训练三天便战胜了训练数月的AlphaGo Lee的主要缘由之一。

德州扑克是梭哈吗_德州扑克27定律是什么_胡莱德州扑克是赌博吗

人工智能不但是计算机科学领域发展的关键制高点，于所有行业具备无限潜力以及应用价值，当前世界各国尤为看好此项技术，人工智能技术会成长为下一次技术革命的契机。就算最终人工智能未达革命级别的颠覆程度，AI也已在慢慢改变我们的生活。

人工智能过去的进步，皆是基于软件跟硬件同步发展的基础，神经网络算法早在上个世纪中叶就被提出来了，可是由于受到计算能力的限制，神经网络算法一直发展得很缓慢。

之后，硬件计算速度持续提高，已有的软件算法不断得以实现并改进，改进后的算法对硬件要求更为苛刻，进而进一步推动了硬件的发展，而AlphaGo Zero的问世完全是基于算法更新的基础之上。。

针对前一版本的AlphaGo，它需要在48个TPU上学习呢（TPU就是谷歌专门为加速深层神经网络运算能力研发的芯片，一块成本高达500万美元呀），而且要学习几个月时间。然而AlphaGo Zero，它只需要4个TPU，加上几天时间就能完成学习。这种零经验学习能力，在蛋白质折叠以及其它不少缺少样本的医疗领域进行应用是非常合适的，能够很好地解决因缺少试验样本而致使研究进展变得缓慢的问题。当下一回相关的研究开展之际，能够将规则予以输入，随后借助AlphaGo Zero的能力来开展模拟工作，最终运用数量有限的样本实施验证便可达成。

AlphaGo逐渐升级之路

故事说到这里，着实不得不钦佩谷歌那深厚的技术实力以及精明的商业头脑，AlphaGo自诞生开始，便获得了deepmind团队的精心包装，认真回想起来，真可谓是“城里套路深”。

从一开始，战胜低段位职业棋手，以此展开预热，或者说是炒作，再到战胜人类顶尖高手李世石，AlphaGo的登场已然足够华丽。然而，4比1的比分还是给了人类一丝希望，在这仅有的胜局里，李世石不走寻常路，直接逼迫AlphaGo出现了“大脑短路”的状况，由此可见，那时AlphaGo虽已足够强大，可仍不完美。此后，各路人类高手开始刻苦自励，精心钻研AlphaGo的套路，寄望于再度捍卫人类尊严。

今年年初期间，随后有其一，以“master”隐秘之名，于围棋界顶级棋手对战平台之上，获取了六十胜零负这般令人瞩目的成绩，这位名为“master”者究竟归属于何方神圣，是人还是妖，此情况可真是引来了众多吃瓜群众的目光关注。一直到达成了那华丽的六十胜战绩之后，谜底才最终得以揭晓。

从那以后，便是一场吸引向了全世界无数视线目光的乌镇激烈对决，AlphaGo Master 将柯洁打得毫无能够还手的力量。尽管柯洁已然展现出了真正属于人类最强者的战斗能力，然而却依旧被 AlphaGo 彻底压制住，只要在出招的时候有任何一丝一毫一点点的闪失失误，马上就会陷入 AlphaGo实行的“最小优势胜”策略所设下的陷阱当中，从此再也没有能够翻身回转的余地了。

德州扑克是梭哈吗_胡莱德州扑克是赌博吗_德州扑克27定律是什么

德州扑克是梭哈吗_德州扑克27定律是什么_胡莱德州扑克是赌博吗

乌镇进行对决以后，人类于围棋这个领域已然是完完全全地承认不如对方，不要说仅仅柯洁这一个人，就算是五大高手一同协作作战，相比柯洁输得还要更快，AlphaGo一时间凭借自身力量做出大事后，显得很有声势，很风光。

这时，乌镇的硝烟才刚刚开始消散，谷歌那边就又弄出了一件大事情！要知道，人工智能在抛弃了人类既有的经验之后，仅仅花费了三天时间进行自我学习，结果AlphaGo Zero就成功击败了人类历经几千年积累下来的经验。而且，AlphaGo的进化版本战胜了原始版本，这不禁让人联想起《铁甲钢拳》当中那些令人心潮澎湃的机甲近身搏斗场景。你瞧，一个人工智能输给了另一个更为厉害的人工智能，还有中国的人工智能战胜了美国的人工智能，这样的情况很有可能就是未来棋类竞技场上将会出现的真实画面呢！

胡莱德州扑克是赌博吗_德州扑克27定律是什么_德州扑克是梭哈吗

有关电影《异形：契约》里面，人类制造出了机器人“大卫”，然而这个大卫觉得自己相较于创造它的人类更为高级，反倒去钻研异形，还杀害人类。电影《I Robot》所采用的剧情设定同样是基于机器人持续进化，从而凭借更出色的逻辑战胜了限制它们的定律，企图夺取地球控制权的故事。

德州扑克27定律是什么_胡莱德州扑克是赌博吗_德州扑克是梭哈吗

胡莱德州扑克是赌博吗_德州扑克是梭哈吗_德州扑克27定律是什么

近年，人工智能技术的发展速度迅猛得着实令人瞠目，就连我那已退休的老娘，都开始在朋友圈转发明目张大吸引他人目光的“AI统治地球论”，尽管或许到最后她依旧不清楚AI究竟是什么含义。

这种论调持有这样的观点，或许在不久后的某一日，人工智能会不再处于执行者的定位，它会成为一名出色的领导者，人类的地位会转变成去替代机器人，完成机器人不方便去执行的工作，就像文章开头所言，人工智能的进化远远领先于人类，并且人类沦为试验对象。

AI统治地球：幻想&有可能？

这样一来，AI的能力真的已经发展到了那般程度？AI主宰地球究竟仅是幻想抑或是确实存在可能性？

各位读者或许也发现了，近些年来，新闻里出镜率相当高的人工智能技术突破，常常是以游戏作为切入点的。从传统的棋牌类游戏，比如象棋、围棋、德州扑克，到电子游戏，像星际、Dota，软件开发精英们似乎老是钟情于跟人类生活联系并不紧密的游戏。

那么，问题就出现了，为什么AI的开发常常将游戏作为切入点呢？谷歌旗下DeepMind公司CEO，AlphaGo之父哈萨比斯给出了这样的回答：“游戏是测试AI算法的绝佳平台，这里拥有无穷无尽的训练数据，不存在测试偏差，能够开展并行测试，而且还能记录每一项能够量化的进展”。用通俗易懂的话来讲，就是花费少，风险低。

在围棋项目里，AlphaGo处于独一无二、甚至孤独求败到需左右互搏的境地，这是无可争议的事实，然而，人类生存所要面对的工作，远远不止下围棋这一件事那么单一，围棋仅仅是人类诸多游戏中的一种，并且，在这些数量众多的游戏当中，围棋的地位，实在称不上是皇冠上的明珠，只是在完全信息博弈游戏这个特定领域内，围棋才被公认为是明珠而已。

至于完全信息博弈游戏具体是什么，我们能够参考之前所发布的文章，名为《AI吊打Dota2人类高手？你可能又被标题党坑了》，。

你提供的内容并不是一个句子呀，请你提供正确的句子以便进行改写。

有一种博弈游戏叫完全信息博弈游戏，在这类游戏里面，每一个参与的人，都拥有了所有其他参与人的特征，还有策略集以及得益函数等方面完全准确的信息，这是一种博弈，尴尬而不失礼的翻译就是，己方的生命值，武器系统，技能系统等相关信息，都被博弈对手完完全全掌握了，反过来也是这样。当然，这里可不是说你将要使出的招法，在出招之前就能被对方预先知道，而是说你只能使用招式表中的招法。对手就算知晓你全部的出招可能性，但是出什么招，何时出招，仍然是你要根据场上形势随机应变，相时而动的。

彼时，非完全信息博弈游戏又如何呢，那自然是同上述的完全信息博弈游戏截然相反，比如说《星际争霸》。但凡玩过类似即时战略游戏的读者都清楚，在此类游戏里，敌人的实时状况我们无法全然把握，不提屏幕仅能展现当下视野，战争迷雾的存在也使得敌我双方状态都变得错综复杂、十分难测，自家范围内的行事情形，敌人不到跟前交战是根本无从知晓的。

德州扑克27定律是什么_胡莱德州扑克是赌博吗_德州扑克是梭哈吗

话若如此这般去看，那围棋 AI 所能去处理的局面可是局限性实在是特别地强，先暂且不去说各类的即时战略游戏，咱们把复杂的情况给进行简化，随便去举几个在日常的生活当中大家都非常熟悉知晓的例子。

麻将，作为中国国粹中的一项内容。在打麻将之时，要是我们处于四方对战形势下，有三位堪称人类高手的存在，再搭配上强大的AI，那么这样的局面究竟会呈现出怎样的状况？

AI确实有着令人惊叹的计算能力，以及超强的记忆能力，它能十分清晰地记住打出的每一张牌，还能精准地算出每一口牌的成胡几率，然而呢，AI却没办法确保每一局都可以取得胜利。这是为何呢？另外三家的牌是扣在那儿的，AI所获得的信息实在是太过有限了，它根本没法掌控战场的全部态势，所以也就没办法发挥出那种压倒性的计算能力。

胡莱德州扑克是赌博吗_德州扑克是梭哈吗_德州扑克27定律是什么

有一种扑克游戏，叫吹牛，是北方小朋友常玩的，哦，它也适合大人和孩子一块儿玩，玩的时候气氛特欢乐。在这个游戏里，自己把几张牌扣着扔出来，告诉对方这是三张六呀，或者一对勾之类的。对方要是选择相信，那就开始由对方出牌，出牌规则同样是扣着牌出，并且报数字和张数。要是对方选择不信，那就得翻开你扣着的牌，要是你的牌和你宣称的数字以及张数相符，对方就得拿走这几张牌，要是不符，你就得把这几张牌收回来。最后谁先把手中的牌全出完，谁就胜利。

在这样的游戏规则情形下，AI没办法全然掌握在对方那里究竟有着怎样的牌，并且也很难去算出对方撒谎的概率，然而反倒是人类能够凭借观察对方的言语神情来判定对方话语可信的程度，如此一来AI具有的计算能力反而变得不知所措了。

有着自主智能，且致力于绞杀人类的那类，类似电影《终结者》系列里的AI“天网”，如今看来依旧仅是狂想，“谋略”这俩字深刻展现出人类智慧达到的高度，运筹帷幄，纵横捭阖，兵不厌诈，目前仍是人类的专利，即便AlphaGo持续在围棋领域制造大动静，我们也没必要惶恐。

与之相反，得以持续提升的AI性能，还有持续不断扩展的应用领域，最终达成的结果依旧是为人类谋福祉。人工智能所具备的发展方向，以及人类同人工智能之间的未来走向，归根结底仍然是人，并非是AI需要去思索的问题。

德州扑克27定律是什么_德州扑克是梭哈吗_胡莱德州扑克是赌博吗

胡莱德州扑克是赌博吗_德州扑克是梭哈吗_德州扑克27定律是什么

“科普中国”是一个品牌，它由中国科协携手社会各方，借助信息化手段，展开科学传播，且具有科学权威的特性。

100:0战胜AlphaGo。 AlphaGo Zero让人类连对手的资格都没有了？

玩德州扑克竟能学到这17条加密货币投资经验，快来看看

人工智能技术在棋牌游戏《Pluribus》中的应用及其现实意义

玩德州扑克竟能学到这17条加密货币投资经验，快来看看

人工智能技术在棋牌游戏《Pluribus》中的应用及其现实意义

dxjj

Related posts

北京推出大众扑克赛事 探索全民健身新路径

牌似人生：德州扑克所蕴含的人生道理启示

吴世春谈投资之道：如德州牌局，待人和善方能抓住良机

北京推出大众扑克赛事探索全民健身新路径