德扑人机大战落幕:AI赢了176万美元 这里是一份超详细的解读

品途商业评论佚名02-02 08:30

德扑人机大战落幕:AI赢了176万美元,这里是一份超详细的解读

复盘AI的德州扑克战术

AI究竟是怎么打德州扑克的?来,我们复盘两局看一下。

第一盘 人类赢了

每一局都有200盲注。

第二盘 AI赢了

人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

会打扑克的AI有什么用?

Libratus在德州扑克人机大战中获得最终的胜利,是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

现实世界中,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈。在围棋界纵横无敌的AlphaGo,本质上处理的还是完美信息博弈,而AlphaGo无法处理德州扑克的问题,更遑论使出诈唬。

未来Libratus这样的AI,可以用于商业谈判、网络安全、医疗方案制定等领域。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

人工智能发展的终极目标,是通用人工智能(AGI)。通用人工智能可以解决任何一个问题,而不是像Libratus或者AlphaGo这样只能专注于扑克或者围棋。想要实现AGI就得让人工智能学会解决不确定性问题,这也是此次人机大战的重大意义之一。

人机大战背后的超级计算机

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

Libratus来自卡内基梅隆大学,而Bridges又是谁?

Bridges不是当今世界最大、最快、最强劲的超级计算机。但它可能是面向公众开放的,最大、最快、最强劲的超级计算机。

研究生物学、地质学、考古学、经济学和其他社会科学的科学家们,都可以得到Bridges的帮助。而此前,这些科学家通常没有机会利用超级计算机,来处理相关领域的大量数据。而这就是Bridges最大的意义所在。

卡内基梅隆大学(还是这个大学,因为它就位于匹兹堡)的教授Jay Apt说,在Bridges的帮助下,原本在个人电脑上要耗时数月的计算,仅仅几个小时就搞定了。

超级计算机本质上是几个计算机联网在一起,以一个整体进行运算。通常要使用2500个电缆连接组件,如果连在一起,可以绕地球……不是,大约是7.2公里。

Bridges的机房有一个双锁的大门,需要用钥匙卡和访问码才能进入。Bridges由27个机架组成,每个大约1.8米高,堆叠的计算机共有三排。冷气从地泵吸入用以冷却。

Bridges提供三种类型的计算选项,称为节点:常规、大型和超大型。常规内存节点具有128GB内存,大约是高端笔记本计算能力的8倍。常规节点共有800个。

Libratus在600-700个节点上运行,这些节点的小子集在打牌时做出决定。而其余的工作则是改善Libratus,让这个人工智能程序可以玩得更好。

电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910