
德州扑克大师奖励升级啦!Iphone、Ipad能零元拿
2026年1月14日
天神娱乐李彦飞:“棋牌+电竞”商业模式新探索
2026年1月14日制作:缪子文化 王轩
监制:中国科学院计算机网络信息中心
2017年10月19日,由谷歌子公司DeepMind发布了AlphaGo的新版本,许多人知晓AlpoaGo是人工智能程序,却并不清楚它实则是一个家族,早期战胜韩国选手李世石的是AlphaGo Lee,在乌镇击败世界冠军柯洁的是AlphaGo Master。此次发布的是AlphaGo Zero,其历经3天训练,就凭借百分之百比零的战绩,打败了它的兄长AlphoGo Lee,又历经40天训练,战胜了它的另一位兄长AlphoGo Master。

AlphaGo Zero最大特点
此次发布的AlphaGo Zero及之前版本相比较,最大的不同之处在于,它并非再借助人类的指引去成长,也就是先前的AlphaGo Lee是依靠人工录入的众多棋谱来助力其学习怎样下棋,简单来讲,它是在人的教导下进行学习,能够理解为是由人类千年围棋经验培育出的学生。
不过,AlphaGo Zero启用了强化学习算法,也就是不再依靠任何棋谱,在编程人员输入围棋基本规则之后,不再予以任何教导,全然由它自身加以探寻,归纳走棋方式,这等同于人工智能完全依照自身的办法去学习。AlphaGo Lee惨败于舍弃了人类经验的AlphaGo Zero,如此这般便表明人类的经验有可能误导了AlphaGo Lee,进而对它的发展形成了限制。
AlPhaGo Zero在开局阶段的行棋方式,与人类选手存在较大相似之处,收官阶段亦是如此,盘中行棋风格却和人类选手以及之前版本的AlPhaGo有着较大差异,正是这种差异使其在与AlphaGo Lee的10多次交战中能够保持不败,换种表达方式来讲,倘若当初AlphaGo Lee并非向人类学习,而是向机器学棋,那么对于具备更强计算能力的AlphaGo Lee而言,胜负结果尚难预料。
AlphaGo Zero的一大特点是把之前版本AlphaGo的两个神经网络合并为一体,这并非零经验学习之外的唯一特点。在之前版本的AlphaGo里,“策略网络”和“价值网络”这两个神经网络负责计算如何走棋。“策略网络”借助之前积累的经验,判断当前棋型下哪些位置适宜行棋;随后“价值网络”对这些位置行棋后的各种可能性予以模拟,计算胜率;最终据此选择出行棋位置。
将二者融为了一体的AlphaGo Zero,对之前两个网络中负责特征提取等工作的模块予以了共用,在计算出有可能行棋的位置之际,就能给出相应的“胜率”,极大地提升了效率,使得训练所需的时间得以减少。这也是AlphaGo Zero在仅仅训练三天便击败了历经几个月训练的AlphaGo Lee的主要原因当中的一个 。

人工智能不只是计算机科学领域里发展的那个制高点,于所有行业而言,都有着无限的潜力以及应用价值,当下世界各国普遍予以看好,关于人工智能技术,其将会成长为下一次技术革命的契机。纵然到最后人工智能并未达到革命级别的那种颠覆程度,然而AI已然在逐步改变我们的生活 。
以往人工智能取得的进步,皆是借助软件跟硬件同步开展的进程来达成的,神经网络算法最初是在上个世纪中叶被提出的,可是,它由于受到计算能力的限制,所以一直以来在发展方面都较为迟缓 。
之后,硬件计算速度持续提高,已有的软件算法持续被实现且改进,改进后的算法对硬件要求更甚,进而进一步推动了硬件的发展,而AlphaGo Zero的出现完全是基于算法更新的基础之上。
前一个版本的AlphaGo,要在48个TPU上学习,TPU是谷歌专门为加速深层神经网络运算能力研发的芯片,单块成本高达500万美元,需花费几个月;而AlphaGo Zero,仅用4个TPU,加上几天时间就能完成学习。这种零经验学习能力,特别适合在蛋白质折叠以及其他缺少样本的医疗领域应用,能很好地解决因缺少试验样本致使研究进展缓慢的问题。在未来的相关研究里,能够输入规则,借助AlphaGo Zero的能力来开展模拟,最终运用有限的样本予以验证,如此便可。
AlphaGo逐渐升级之路
至此故事讲述到这儿,着实不得不钦佩谷歌那深厚的技术本事以及精明的商业脑筋。AlphaGo自诞生起始,便获得了deepmind团队谨慎的包装,认真回想起来,真可说是什么“城里套路深”呢。
在最初的时候,凭借战胜段位较低的职业棋手来展开预热,或者也可以说是炒作,而后又成功战胜人类顶尖高手李世石,AlphaGo的登场已然是足够华丽了。然而,4比1的比分还是给了人类一丝希望,在这仅有的胜局当中,李世石不走寻常路,直接致使AlphaGo出现了“大脑短路”的症状,由此得以看出,此时的AlphaGo尽管已经足够强大,可是还并非完美无缺。从那之后,各路人类高手纷纷开始卧薪尝胆,精心钻研AlphaGo的套路,寄望于能够重新捍卫人类尊严。
随后,今年年初,一个神秘的“master”,在围棋界顶级棋手的对战平台上,取得了60胜0负的骄人战绩,这位master究竟为何方神圣,是人还是妖,可说是赚足了吃瓜群众的眼球。直到华丽的60胜达成,谜底才最终揭晓。
在此之后,便是吸引了全世界目光的乌镇对决,AlphaGo Master把柯洁逼迫到毫无还手的能力,尽管柯洁已然展现出了真正的人类最强者的战斗实力,可依旧被AlphaGo全面压制,只要出招存在任何一丝一毫的失误,迅即会陷入AlphaGo“最小优势胜”策略的圈套之中,进而再没有获取胜利的可能。


乌镇进行对决之后,人类于围棋这个领域已然是完全心甘情愿地承认不如人,不要说仅仅柯洁这一个人,就算是五大高手一起联手展开作战,相比柯洁输得还要更快,AlphaGo一时间呈现出了极其得意的样子。
如今,乌镇的硝烟才刚刚开始消散,谷歌那边就又弄出了一个大新闻!人工智能在将人类经验抛弃之后,凭借三天自学的时间,让AlphaGo Zero把人类历经几千年积累的经验给打败了。AlphaGo的进化版本战胜了原始版本,这不禁让人联想起《铁甲钢拳》里那种能让人热血沸腾的机甲肉搏场面,一个AI输给了另一个更强的AI,中国的AI战胜了美国的AI,这极有可能会成为未来棋类竞技当中的真实情形。

电影《异形:契约》里,人类制造出了机器人“大卫”,大卫觉得自己比制造它的人类还要高级,反倒去搞异形研究,还杀害人类。电影《I Robot》采用的剧情设定是,基于机器人持续进化,从而凭借更出色的逻辑战胜了限制它们的定律,企图夺取地球控制权的故事。


人工智能这项技术,在近些年的发展进程当中,其速度迅猛异常,着实令人感到瞠目结舌,就连已经退休在家安享晚年的老娘,都开始在自己的朋友圈里转发各种各样能够博人眼球吸引他人注意力的“AI统治地球论”,即便到最后,她或许依旧还是不清楚AI究竟是什么含义意思。
这种论调持有这样的观点,或许在不久后的某一日,人工智能会不再处于执行者的定位,它将会成为一名出色的领导者,另外人类的地位会转变为去替代机器人,去完成机器人不方便开展执行的工作,犹如文章开头所讲的那样,人工智能的进化幅度远远大于人类,进而人类沦为了试验对象。
AI统治地球:幻想&有可能?
那么,AI的实力真的已经进化到了那般程度吗?AI统治地球究竟只是幻想,还是确实存在可能性呢?
各位读者或许察觉到了,近些年里,新闻内出镜概率颇高的人工智能技术突破,常常是以游戏作为切入要点的,从传统的棋牌类游戏,也就是象棋、围棋、德州扑克开始,再到电子游戏譬如星际、Dota,软件开发方面的精英们好像始终颇为青睐与人类生活关联并不紧密的游戏。
话说到这儿,新的疑问就冒出来了,为啥AI在进行开发之际常常会把游戏当作切入的关键点?身为AlphaGo之父,同时也是谷歌旗下DeepMind公司CEO的哈萨比斯给出了这般的回答:“游戏是用于测试AI算法的堪称完美的平台,在这儿有着数目无限的训练数据,不存在什么测试偏差的情况,能够开展并行测试,并且还能够记录下每一个能够被量化的进展情况呢”。用通俗易懂的话来讲就是,花费的资金比较少,所面临的风险也比较小。
不争的事实是,AlphaGo在围棋项目那里独步天下,甚至孤独求败到要左右互搏,然而人类生存所需面对的工作,绝不是下围棋这一件事这般简单,围棋只是数不清的人类游戏里的一种,并且在这些诸多游戏之中,围棋的位置实在谈不上是皇冠上的明珠,它仅仅是在完全信息博弈游戏这个领域内,才是大家公认的明珠而已。
就关于什么才算是完全信息博弈游戏而言,我们能够去参照之前所发布出来的、叫做《AI吊打Dota2人类高手?你可能又被标题党坑了》的文章 。
这不是一个可改写的句子呀,它看起来像是一个链接呢,你可以给我提供正确的句子内容以便我进行改写😃 可如果严格按照要求,非要改写它的。
完全信息博弈游戏:于这类游戏里,每一个参与者都是拥有着所有其他参与者的特征、策略集以及得益函数等方面准确信息的博弈,尴尬而不失礼的翻译是,己方的生命值、武器系统、技能系统等相关信息全被博弈对手完全掌握,反过来也是如此。当然,这里并非指你将要使出的招法在出招之前就能被对方预知,而是讲你仅能使出招式表中的招法。对手就算知晓你的全部出招可能德信竞技,出什么招、何时出依旧是你依据场上形势随机应变、相时而动的。
可是,那非完全信息博弈游戏又是怎样的呢?自然就是与上面所讲的完全信息博弈游戏截然不同啦。比如说,有一款名为《星际争霸》的游戏。但凡玩过类似风格即时战略游戏的读者都清楚,在这类游戏当中,敌人的实时状况我们没办法做到完全了解。先不说屏幕仅仅能够展示当前所处视野范围,单是战争迷雾(war fog)的存在,就使得敌我双方各自的状态都变得捉摸不透,令人难以辨别。你在自己基地处做些什么事情,要是敌人不主动跑过来与你打上一仗,那是根本无法知晓的。

如果从这方面去观察,那围棋人工智能能够应对和处理的那种局面,实际上还是在局限性这一块表现得过于突出了,暂且不说各种各样的即时战略类型游戏,咱们把复杂的情况进行简化那么做,来列举几个在平常生活当中大家都比较熟悉知晓的示例。
具备中国国粹之一属性的麻将,若是在打麻将之时,假定存在四方对战模式,其中有三位人类高手以及强大AI参与其中,那局面究竟会呈现怎样的状况呢?
AI确凿无疑地具备令人惊叹至极的计算能力,对于每一张打出的牌,它都能记得分毫不差,对于每一口牌的成胡几率,它都可算得精准无误,然而,即便如此,AI也依旧无法确保在所进行的每一局当中都能够如愿地取得应有的胜利。原因究竟何在呢?另外三家的牌是扣置于那里的,AI所能获取到的信息实在是非常地有限,以至于根本没办法全然把握战场的整体态势,既然如此,自然也就难以充分施展其具备的压倒性的计算能力 。

有一种扑克游戏,是北方小朋友常玩的吹牛,这游戏也适合大人小孩一块儿玩,氛围极度欢乐,在这个游戏里,自个儿抛出几张扣着的牌,跟对方讲说这是三张六或者一对勾之类的,对方若选择相信,便开始由对方出牌,出牌规则同样是扣着出然后报数字和张数,对方若选择不信那就得翻开你扣着的牌,要是你的牌跟你所声称的数字和张数相符,对方就得拿走这几张牌,要是不符,你就得收回这几张牌,最后谁先把手中牌全出完就算胜利 。
在这样的游戏规则情形下,AI没办法完全知晓对方手中究竟持有怎样的牌,并且也很难计算出对方撒谎的概率,与之相反的是,人类能够借助察言观色去判断对方话语的可信程度,如此一来,AI的计算能力反倒变得无所适从了。
就当前情形来说,像电影《终结者》系列里的那种具备自主智能且一心要把人类绞杀殆尽的AI“天网”,依旧仅仅是狂想而已。“谋略”这两个字呢,深切地彰显出人类智慧所抵达的高度,能够在策划指挥时全面掌控局势、在人际交往中施展手段灵活应对、在竞争对抗中采用各种计谋策略,目前来讲这些仍然分别是人类的专利。哪怕AlphaGo总是在围棋那个领域制造出引人瞩目的重大事件,我们也不存在需要惶恐的情况。
相反,有着持续提升态势的AI性能,还有持续扩展态势的应用领域,然而最终的结果仍是会给人类带来福祉。人工智能的发展方向,以及人类与人工智能的未来,终归到底都是在于人类,而并非是AI所需去思索的问题。


有一个名为“科普中国”的,是中国科协跟社会各方一起借助信息化手段来开展科学传播的科学权威品牌 。


