AlphaGo在网上快棋中连胜职业高手60盘之后,人类终于要开始反攻:目前世界围棋第一人柯洁将要在4月与AlphaGo进行面对面对决,人类能否挽回智慧尊严?但在此之前,人类又丢掉了一座智慧堡垒——德州扑克。在这周结束的德州扑克人机大赛中,人工智能Libratus战胜四位德州扑克顶级选手,获得最终胜利。
这场扑克比围棋更难
此次人机大赛在美国匹兹堡的河流赌场(Rivers Casino)进行,比赛名为“大脑对抗人工智能:再次挑战”(Brains vs. Artificial Intelligence: Re-Match),比赛于1月11日开始,一直持续至30日。共有4位世界顶尖的专业级扑克选手与AI进行对决,他们和Libratus进行一对一对决,或是二对一对决,争夺20万美元的奖金,比赛项目为无限额下注德州扑克(no-limit Texas Hold ‘Em)。
不同于围棋、国际象棋这些游戏,无限额下注德州扑克是一种赌博游戏,且是非完美信息博弈。在一般的完美信息博弈中,对决双方都能获得相同的确定性信息,比如对方的棋子情况,棋盘剩余空间情况等。但在扑克游戏中,会有多个玩家存在,且进行的是暗牌玩法,以德州扑克为例,每个玩家都会率先分到2张底牌,也就产生了隐藏信息,需要进行心理战来推测牌局,甚至得靠运气才行。对于AI来说,在进行完美信息博弈时,它可以利用各种算法,搜索计算取胜的最佳路径,但在非完美信息博弈中,AI的计算推理能力就会遭遇极大挑战。
另外,“非一对一对决”和“无限额下注”也增加了比赛的难度。无限额下注是指每轮下注过程中,对下注金额没有任何限制,但如果要加注,加注额最少要是之前玩家下注额的两倍。比如玩家A下注10元,玩家B可以加注到50元,但玩家C若要加注,则最少要下注100元。这种下注玩法大大增大了游戏的风险,让牌局走向变得更难以预知。
也正是由于以上这些高难度属性,无限额下注德州扑克一直被认为是AI难以攻克的智慧堡垒之一。在2015年举办的德州扑克人机大赛上,Libratus的“前辈”、人工智能Claudico就曾向人类发出挑战,最终以较大劣势失败。
Libratus到底什么来头?
今年前来参战的Libratus显然不容小觑,曾于去年打败Claudico的扑克选手金东(Dong Kim)在今年尝到了失败的滋味。“直到今天和AI比赛过,我才意识到它有多厉害。就好像它作弊了那样,它仿佛能看穿我手中的牌。”金东在和Libratus完成对决后,感叹他和他的队友们几乎没有获胜的可能。
Libratus在拉丁语中意味着“平衡”,这款人工智能软件由卡内基梅隆大学(Carnegie Mellon University)电脑科学系教授托马斯•桑德霍尔姆(Tuomas Sandholm)和他的博士生诺姆•布朗(Noam Brown)一同开发。桑德霍尔姆教授同时也是人工智能Claudico的创造者。不过桑德霍尔姆教授并没有公布Libratus的相关技术,表示会等到此次人机大赛结束后才“揭秘”。
桑德霍尔姆教授仅表示,在进行人机大战期间,Libratus一直借助匹兹堡超级计算机中心(Pittsburgh Supercomputing Center,简称PSC)进行算法运行,并会在每天的比赛中不断完善自身。这一点也得到了了比赛选手们的确认。“Libratus就像是加强版的我们,它每天都比前一天做得更好。”扑克选手吉米•周(Jimmy Chou)评价道,“每当我们抓到它一个弱点或漏洞后,它就会从我们身上学到这一点,在第二天比赛时,这些弱点就都消失了。”
据比赛官网透露,Libratus其实并非是针对扑克游戏而创造的,它可以用于各种需要对非完美信息进行处理的事务,比如商务洽谈、药品研究、网络安全、拍卖等等。而Libratus的“后台”卡内基梅隆大学也有着极强的AI背景。该大学在人工智能研究领域一直处于领先地位,在无人驾驶汽车、自动翻译、机械自我学习等方面都有突出成就。此外,曾于1997年打败国际象棋大师的电脑“深蓝”(Deep Blue)、在电视问答游戏节目《危险边缘》(Jeopardy!)中拿到2011年年度冠军的人工智能Watson,以及苹果的电子助手Siri,这些项目的打造都有卡内基梅隆大学的参与。
拿下扑克首胜的AI,另有其人
虽然Libratus横扫人类专业扑克选手的战绩震惊全球,但它却并非第一个完成此项壮举的AI——1月6日,卡内基梅隆大学的“宿敌”加拿大阿尔伯塔大学(University of Alberta)公布了一份名为《DeepStack:无限注德扑的专业级人工智能玩家》的论文,表明其AI研究团队已研发出可在一对一无限注德扑中战胜专业扑克选手的人工智能。
DeepStack人工智能是由阿尔伯塔大学、捷克查理大学和捷克科技大学联手打造的,项目由麦克•保林(Michael Bowling)教授主导。根据论文资料,DeepStack在运用深度学习,反复自我博弈之后,能够在每一个具体牌局情境下进行推理,作出相应决策。最重要的是,DeepStack能够通过自我学习,获得近似人类的直觉,或者说扑克选手们引以为傲的“牌感”。当然,这并非真的直觉,而是DeepStack能够通过一种快速近似估算,只对当下情境进行计算,避免对整个游戏剩余部分进行繁杂的处理。
阿尔伯塔大学团队共邀请了来自国际扑克联盟(International Federation of Poker)的33位专业选手与DeepStack进行牌技较量,比赛共持续了4周。DeepStack战胜了其中部分人类选手,且从胜率上来看,它的牌技已令其踏入职业选手的门槛。不过,DeepStack虽然拿下了扑克首胜,但无论是其研发团队,还是对手桑德霍尔姆教授,都认为其还需要完善。桑德霍尔姆教授评判称,DeepStack所面临的对手,与Libratus的对手并不在一个数量级,Libratus所进行的比赛总手牌数也要远超于DeepStack。
但无论这两个AI团队的竞争如何激烈,有一点是确定的:在扑克领域,甚至是整个非完美信息博弈游戏领域,人类都将很快被人工智能超越。当然,我们仍然心怀希望——德州扑克“阵亡”了,我们还有斗地主和麻将能够抵御AI不是?
👇点击视频帮小编加鸡腿!👇