
战略|寻找三枪虚张声势的合适条件
2026年1月14日
新手学德州扑克GTO策略,这4个建议请收好
2026年1月14日制作:缪子文化 王轩
监制:中国科学院计算机网络信息中心
2017年10月19日,谷歌子公司DeepMind作出AlphaGo新版本发布活动举动,众多知晓AlphaGo为人工智能程序之人士,却并不清楚其实则成一家族形态,早期于赛事中战胜韩国选手李世石者乃AlphaGo Lee,在乌镇之地击败世界冠军柯洁者则是AlphaGo Master 。本次发布的是AlphaGo Zero,它在经过3天训练后,以100:0的战绩,击败了它的哥哥AlphoGo Lee,又在经过40天训练后,击败了它的另一个哥哥AlphoGo Master。

AlphaGo Zero最大特点
本次所发布的AlphaGo Zero,跟之前的版本相比较而言,其最大的区别之处在于,它并非依靠人类加以指导进而成长起来,也就是说,之前的AlphaGo Lee是借助人工去录入数量诸多的棋谱,以此来协助它学习怎样下棋,说白了,它是在人的引导之下展开学习的,可以理解成是由人类历经千年积累的围棋经验所培育出来的学生。
而是用了强化学习算法的AlphaGo Zero,不再依赖任何棋谱,编程人员输入围棋基本规则后,不再进行任何教导,完全由它自己摸索,总结走棋方法,等效于人工智能全部按照自身方法学习。AlphaGo Lee完败于摒弃人类经验的AlphaGo Zero,这意味人类经验或许误导了AlphaGo Lee,进而限制了它的发展。
开局以及收官阶段,AlphaGo Zero的行棋方式的确表现上,和人类选手有着较大程度的相似之处,盘中的行棋风格,确实与人类选手以及之前版本的AlPhaGo存在较大差异,这种差异进而使它能够在100次与AlphaGo Lee的交战里保持不败,如果当初AlphaGo Lee没有以人类的指导为师,而是向机器学习,那么对于计算能力更强的AlphaGo Lee而言,胜负结果还难以知晓。
除了零经验学习之外,AlphaGo Zero的另外一大特点在于,把之前版本AlphaGo的两个神经网络合并为一体,在之前版本的AlphaGo那里,怎样走棋是依靠“策略网络”和“价值网络”这两个神经网络来计算如何行棋的,也就是,首先借助“策略网络”运用之前积累的经验,判定在当前棋型状况下哪些位置适宜行棋,随后由“价值网络”针对在这些位置行棋之后的种种可能性展开模拟,计算胜率,最终挑选出行棋位置。
AlphaGo Zero把二者融合成了一体,针对之前两个网络的特征提取等模块进行了共同运用,能够在计算出具有可能性的行棋位置之际就给出相应的“胜率”,极大地提升了效率,使得训练所需的时间得以减少。这也是AlphaGo Zero在经过三天的训练就战胜了历经几个月训练的AlphaGo Lee的主要原因当中的一个 。

计算机科学领域发展的制高点之中,人工智能占据其一不仅于此,在所有行业它都具备难以限量的潜力以及应用价值,当下世界各国普遍持有看好的态度,人工智能技术会成长为下一次技术革命的契机。就算最后人工智能并未达成革命级别那般的颠覆性影响,AI也已然在渐渐改变我们的生活之处存在改变 。
此前人工智能所取得的进步,皆是搭建于软件跟硬件同步向前发展的根基之上,神经网络算法早在上个世纪中叶便已被提出来了,可是由于受到计算能力的限制,神经网络算法始终发展得较为迟缓。
在此之后,随着硬件计算速度持续提高,已有的软件算法不断得以实现,并且不断被改进,改进后的算法对硬件要求更为苛刻,进而进一步推动了硬件的发展,而AlphaGo Zero的出现则完全是建立在算法更新的基础之上的。
相较于前一版本的AlphaGo,其需要在48个TPU:也就是谷歌专为加速深层神经网络运算能力而生的芯片,且一块成本高达500万美元的那种芯片上,进行长达几个月的学习。然而AlphaGo Zero却不同,它仅需4个TPU额外再花上几天的时间之后就能够完成学习。这种具备零经验的学习能力,在蛋白质折叠以及其它缺少样本的医疗范畴里进行运用是极为契合的,能够恰如其分地解决因缺少试验样本从而致使研究进展变得缓慢的这一问题。在未来的相关研究里头,能够输入规则,接着借助AlphaGo Zero的能力来开展模拟,最终运用有限的样本予以验证就行。
AlphaGo逐渐升级之路
就剧情发展到此处而言,着实没办法不钦佩谷歌所具备的极其深厚的技术能力和相当精明的商业思维,从AlphaGo开始出现的那一刻起,便收获了deepmind团队精心的打造,认真回忆一番,真的可以说是“城里的手段太复杂”。
最开始,从战胜低段位职业棋手着手进行预热,或者说是炒作,接着战胜人类顶尖高手李世石之时,AlphaGo的登场已然足够华丽。然而,4比1的比分还是给了人类一丝希望,在这仅有的胜局里,李世石采取了与众不同的策略,直接致使AlphaGo出现了“大脑短路”的状况,由此可见,那时AlphaGo尽管已经足够强大,可还并非完美。此后,各路人类高手开始刻苦努力,深入钻研AlphaGo的套路,寄望于能够再度捍卫人类尊严。
随后,在今年年初的时候,一个神秘的“master”,于围棋界顶级棋手的对战平台之上,取得了60胜0负这样令人骄傲的战绩,这位master究竟是来自何处的神圣人物,到底是人还是妖,可以说是充分抓住了吃瓜群众的眼球。一直到其达成了华丽的60胜之后,谜底才最终被揭晓。
之后,就是那场吸引了全球目光的乌镇对决,AlphaGo Master把柯洁打得一点还手之力都没有。尽管柯洁已然展现出了真正人类最强者那般的战力,然而,依旧遭到AlphaGo的全力压制,只要出招的时候有任何一点点的闪失,马上就会掉进AlphaGo“最小优势胜”策略所设的陷阱里,压根就没法翻身了。


乌镇进行对决后,人类于围棋领域已然完全心悦诚服,且不说柯洁仅为一人单枪匹马应付,哪怕有五大精通围棋的高手联起手来共同应对,其败北速度也会比柯洁本人更快,故而AlphaGo在当时那一阶段处在无限风光的景况之中。
当下,乌镇大战硝烟才刚要渐渐消散,谷歌却又弄出了一件超级惊人的大事件!人工智能在将人类经验完全摒弃之后,凭借仅仅三天的自学时间,其研发的AlphaGo Zero竟然战胜了人类历经几千年积累下来的经验。AlphaGo的进化版本居然打败了原始版本,这不禁让人回想起在电影《铁甲钢拳》里那些令人血脉偾张的机甲近身搏击场景,在此情境下,一个人工智能输给了另一个更为厉害的人工智能,而且是中国的人工智能战胜了美国的人工智能,如此这般,极有可能会成为未来棋类竞技领域当中真实会出现的场景。

《异形:契约》这部电影里,人类制造出机器人“大卫”,大卫却觉得自己凌驾于创造它的人类之上,接着去钻研异形,还杀害人类。电影《I Robot》所采用的剧情设定同样是基于机器人持续进化,随后凭借更出色的逻辑击破了限制它们发展的固有定律,并试图夺取地球的控制权,讲述的就是这类具有如此这般情节走向的故事 。


近年,人工智能技术的发展速度迅猛得着实令人瞠目,就连我那已退休的老娘,都开始在朋友圈转发各类博人眼球的“AI统治地球论”,尽管最后她很可能依旧不清楚AI到底是啥意思 。
有种论调这么觉得,说不定在不远的某一日,人工智能不会再处于执行者的定位了,它会转变成一个出色的领导者,人类的地位会变成去替代机器人,做机器人不方便去执行的工作,就像文章开头讲的那样,人工智能的进化比人类领先很多,人类沦为了试验对象。
AI统治地球:幻想&有可能?
那么,AI的实力真的已然进化到了那般田地?AI统治地球究竟只是幻想,还是确实存在可能性呢?
诸位读者或许也留意到了,近些年来,于新闻里面出镜频率颇高的人工智能技术突破,常常是以游戏当作突破的切入点,从传统的棋牌类游戏,像象棋、围棋、德州扑克这类,再到电子游戏,比如星际、Dota这些,软件开发精英们好像一直都偏好与人类生活关联并不紧密的游戏。
那么,问题就如下这般出现了,为什么AI的开发常常会把游戏当作切入点呢?谷歌公司旗下DeepMind公司的CEO,也就是AlphaGo之父哈萨比斯给出了如此这般的答案:“游戏是对AI算法进行测试的堪称完美的平台,在这片领域当中存在着无穷无尽的训练数据,不存有测试偏差,能够开展并行测试,而且还能够记录下每一个能够被量化的进展情况”。用人话进行表述的话,意思就是花钱较少,风险较小。
AlphaGo在围棋项目里独自行走于天下,甚至孤独到寻求失败以至于要自己和自己对弈,这是不可争辩的事实,然而人类为了生存所要面对的工作绝对不是如同下围棋这般只是一件事情那么的简单。围棋仅仅是无数人类所参与的游戏当中的一种,并且在这些数量众多的游戏里面,围棋所处的位置真的算不上能够称之为皇冠上最为璀璨的那颗明珠,只不过是在完全信息博弈这类游戏的这个特定领域范围之内,围棋才是被大家所公认的明珠而已。
至于,什么是,完全信息博弈游戏,我们能够,参考,之前德信竞技,发布过的,文章,《AI吊打Dota2人类高手?你可能又被标题党坑了》,。
你提出的并不是一个句子呀,请提供正确的句子以便进行改写 。
完全信息博弈游戏:于这类游戏里,每一位参与者俱拥有所有其他参与者的特征、策略集以及得益函数等方面的精准信息的博弈,尴尬而不失礼的翻译为己方的生命值、武器系统、技能系统等相关信息皆被博弈对手所全然掌握,反之亦是如此。当然啦,此句含义并非暗示你即将使出的招法在出招之前便能被对方预先知晓,而是表明你仅能使出招式表中的招法。对手纵使知晓你的全部出招可能性,至于出什么招、何时出,依旧是你依据场上形势随机应变、相时而动的。
那非完全信息博弈游戏又是怎样的情况呢,它当然是和上面所说的完全信息博弈游戏截然不同的,比如说,有一款叫《星际争霸》的游戏。那些玩过类似即时战略游戏的读者都清楚,在这类游戏之中 ,敌人的实时状况这是我们没办法完全了解的,先不说屏幕仅仅能够展示当前的视野范围,单是战争迷雾也就是war fog的存在 ,就使得敌我双方的情形都变得难以捉摸模糊不清了,你在自己占据的主基地做什么事情 ,要是敌人不过来发动一场战斗那是根本没法知道的。

这般看来,围棋人工智能所能够应对处理的局面,实在是局限程度太过强烈了,暂且不说各类即时战略游戏,我们把复杂的情况化简,列举几个日常生活当中各位都熟悉知晓的例子。
中国有一国粹名为麻将,当我们打麻将时,假定是四方对战,其中有三位人类高手,还有强大的AI,那么局面会呈现出怎样的状况呢?
AI确实有着令人惊叹的计算能力以及记忆能力,它能够把每张打出的牌都精准清晰地记住,还能将每一口牌的成胡几率都精确无误地算清楚,然而AI却没办法确保每一局都可以获取胜利。这是为何呢?另外三家所扣着的牌就在那里,AI所得到的信息实在是太过有限了,它没有办法掌控战场的全部态势,所以也就没办法发挥出那种具有压倒性的计算能力。

所谓吹牛,乃是北方小朋友时常玩的一种扑克游戏了,当然啦,这种游戏也适宜大人跟孩子一块儿玩,其气氛特别欢乐。在这个有吹牛之称的扑克游戏里,自己要扔出几张扣着的牌,还要告知对方,这几张牌是三张六点或者一对勾之类的。要是对方选择甘愿相信,那么就会开始由对方出牌,出牌的这般规则同样是扣着牌出牌,之后再报出数字以及张数。要是对方选择不相信,那就得翻开你扣着的那些牌,要是你的牌跟你所声称的数字以及张数能相吻合,对方就得拿走这几张牌,要是两者不相符,那你就得收回来这几张牌。最终,先把手中所有牌都出完的那个人就是胜利的一方咯。
如此这般的游戏规则情形下,AI没办法全然知晓对方手里究竟有着怎样的牌,也极难算出对方说谎的概率,反倒是人类能够借助观察对方的言语神情来判定对方话语的可信程度,AI的计算能力反倒变得不知如何是好了。
在目前,那种类似电影《终结者》系列里具有自主智能且一心要绞杀人类的AI“天网”,依旧只是狂想。“谋略”这俩字,深刻地体现出人类智慧所达到的高度,能够做到运筹帷幄、纵横捭阖、兵不厌诈,目前这暂且还是人类独有的本事。哪怕AlphaGo在围棋领域老是制造大事件,我们也没必要感到惶恐。
与此相反,持续提升的AI性能,持续扩展的应用领域,到头来得出的最终结果依旧是造福人类,人工智能的发展方向,以及人类和人工智能的未来根本上毕竟仍是人类,并非AI需要权衡思索的问题。


中国科协联合社会各方,借助信息化手段,开展科学传播,打造了“科普中国”这一科学权威品牌。


