我是孔雀城,你敢接受挑战吗?
2026年2月14日
专访德扑AI专家:揭秘德扑AI不靠深度学习靠‘谈判’的原理
2026年2月14日
国外媒体宣称,美国那本名为《科学》的周刊,在11日发布了一项研究德信竞技,这项研究表明,由脸书公司以及美国卡内基-梅隆大学一同研发出来的人工智能,也就是那个被称作“Pluribus”的系统,在六人制的德州扑克比赛当中,战胜了5名职业选手。
按照埃菲社7月11日所做的报道来看,这属于当下唯一的,在多人参与的比赛里面,表现能够超过人类扑克选手的AI系统。在这之前,于扑克比赛当中击败人类,是少数AI没办法完成的挑战中的一项。
有报道声称,对于AI系统来讲,扑克拥有如同国际象棋等别的游戏所没有的困难之处,也就是“信息不对称”,因为桌面上存在一些牌一直是以背面朝上的状态,玩家仅仅能够知晓游戏进程的一部分,所以,若要取得胜利就必定要理解并猜测别的玩家的行为,这其中涵盖辨别对手何时是在虚张声势以及自己运用虚张声势的手段去欺骗对手。
该研究报告作者,也就是图奥马斯·桑德霍尔姆和诺姆·布朗,于实验范畴之内呢,选用、采取了“行动抽象”以及“信息抽象”这样的技术手段,以此来削减、降低人工智能在一局游戏当中所需去考虑的行动数量哦。
就他们所讲,强化学习系统跟新算法的衔接是机器得以战胜人类的关键所在。这款由他们跟脸书一同研发的名为“Pluribus”的AI系统,在一回又一回跟自身副本的对抗当中,学会了怎样在六人制无限制德州扑克比赛里取得胜利。
于此场景,即为于跟副本开展游戏期间,该AI系统生成了一套既定策略——是被科学家们称作“行动计划”的那套策略,而于跟真实对手进行比赛之际,Pluribus会借助找寻些其他对于应对当局游戏来讲更具成效的即时行动,以此去改良这套既定策略。
实际上,Pluribus运用算法所给出的某些反馈,就连其开发者都颇感意外。多数职业扑克玩家会避开这样一种明显不符合逻辑的下注形式,也就是术语里所说的“驴式下注”,其唯一目标是干扰在那游玩里占据主导地位的玩家。可是呢,Pluribus运用此下注方式的频率相对较高。被它打败的职业选手之一达伦·伊莱亚斯讲:“AI最为强大之处在于它施行混合策略的能力。我们人类选手也想着去做同样的事情,然而在执行方面存在着问题。”。以完全随机的方式持续进行这种操作非常难。”
桑德霍尔姆指出,在此之前,在关于战略思维方面,超越人类的AI所获取的重大成就,仅仅局限于二人对决,然而,在这般复杂的游戏里,击败5名玩家的能力,为借助AI解决现实世界当中形形色色的问题,提供了全新的机会。


