专栏名称: TechWeb
TechWeb专注于互联网消费领域,每日专业提供互联网产品、智能设备及互联网服务等方面的最新资讯。
目录
相关文章推荐
新浪科技  ·  【独家 丨 ... ·  2 天前  
新浪科技  ·  【#李子柒为何出走三年归来仍是顶流# ... ·  3 天前  
51好读  ›  专栏  ›  TechWeb

人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

TechWeb  · 公众号  · 科技媒体  · 2017-01-27 12:30

正文

今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听……

报道 | 量子位 舒石

 今早最新战报:人工智能Libratus已经赢了100多万美元

百万美元

年三十儿的黎明来临时,数字定格在106.5万美元。

Dong Kim充满挫败感。Kim是一个高风险扑克玩家,擅长无限注的德州扑克。通常,这位28岁的韩裔美国人在高额赌注网站或拉斯维加斯的大赌场,与其他顶级玩家谈笑风生。但是这个月,他在美国匹兹堡河流赌场,对决一台人工智能机器。

2017年以前,没有电脑在无限注德州扑克领域击败过顶级玩家。大约两年前,Kim曾在同一个赌场击败了这个人工智能的前身。但这次有所不同。上周五晚上,在这场为期二十天的比赛刚刚过半之时,Kim直言:人类已经没有真正获胜的机会。

“我直到今天才意识到它玩的有多好,那感觉就像跟一个出老千的人一起玩,好像它能看透我的牌”,Kim回到酒店房间开始为第二天做准备,“我不是指责它作弊,它就是玩得那么好”。

这个机器叫做Libratus,在拉丁文里意思是平衡。“各种套路它都用了”,Kim说这个人工智能并不会用同样的策略打牌。诈唬(bluff)的时候,它可能是一手好牌,也可能是烂牌。这意味着Kim很难在对抗中找到漏洞。如果他找到一个漏洞,第二天就会消失不见。

比赛进行十余天后,和Kim一起出战的几个顶级人类玩家说他们也许能勉强打个平手,但肯定赢不了。目前,机器已经领先了100多万美元。

对局实录

Libratus之所以能赢这么多,就是诈唬干得好。

我们来实际看一手牌。人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

匹兹堡之战

从1月11日-30日,每天上午11点-下午7点,匹兹堡河流赌场的扑克室。四位人类顶尖扑克玩家,与电脑Libratus展开德州扑克大战。

如果Libratus像预期的那样,获得最终的胜利,将是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

每一天,Libratus都会进步。而在匹兹堡,Dong Kim又累又沮丧,感觉很失败。不过,即使Libratus很快会获得最终胜利,这并不意味着卡牌桌对人类不再适合。Libratus目前的技术,还不能用于多人对局的无限注德州扑克较量之中。

相关信息

人工智能Libratus由卡内基梅隆大学计算机教授Tuomas Sandholm,和他的博士生Noam Brown共同开发。Libratus的对手,分别是扑克高手:Dong Kim,Jimmy Chou,Jason Les,Daniel McAulay。

这场对决名为:《Brains Vs. Artificial Intelligence: Upping the Ante》,大脑对战人工智能。Libratus和它的四个对手,会在这场总共12万手的一对一无限注德州扑克比赛中进行角逐。人类不仅要捍卫自身的荣誉,比赛还提供了一个20万美元的奖金包。

开发这个程序还有更多的意义。在不完美信息的博弈中,需要人工智能进行诈唬和正确解读误导信息才能获胜。像Libratus这样的程序,还可以用于洽谈商业协议、执行军事战略或计划治疗方案。所有基于不完全信息的复杂决策都可能适用。

Libratus不是唯一的扑克人工智能,几个不同的研究小组都专注于此。来自加拿大Alberta大学,捷克共和国Charles大学和捷克技术大学的一个学术团队,最近开发了一个称谓DeepStack的人工智能。这个程序也在比赛中战胜了人类。

基于深度学习,进行自我博弈之后,DeepStack学会根据具体情境进行推理:对当前情境下对个人牌面大小的判断,并作出相应的决策。

DeepStack比Libratus更早在无限注德州扑克游戏中击败人类。不过,Sandholm说Libratus面对的对手实力更强,而且比赛数据积累的更多,能够提供具有更大统计意义的结果。

距离比赛结束没有几天了,视频网站twitch每天都有直播。直播的传送门,点击左下角的阅读原文。

另外,河流赌场的官网也能围观这场赛事,赌场搞了一个专题页面。赌场的网站就不公开贴了,如果有感兴趣的朋友,可以在量子位公众号(搜索:量子位 或 qbitai),然后回复“赌场”。

有人会悄悄告诉你另一个传送门的地址。


 关注『量子位』

了解AI行业最新动态