专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  【Flow Matching and ... ·  昨天  
宝玉xp  ·  Cloudflare Workers AI ... ·  昨天  
AI范儿  ·  Claude 上线联网功能,但翻车了 ·  2 天前  
AI范儿  ·  Claude 上线联网功能,但翻车了 ·  2 天前  
爱可可-爱生活  ·  从协作式自我对弈中学习认知边界 查看图片 ... ·  3 天前  
爱可可-爱生活  ·  [LG]《PENCIL: Long ... ·  3 天前  
51好读  ›  专栏  ›  机器之心

学界 | 新论文提出玩扑克人工智能DeepStack:已达职业玩家水平

机器之心  · 公众号  · AI  · 2017-01-10 12:09

正文

选自arxiv.org

机器之心编译

参与:吴攀、李亚洲


当地时间 1 月 11 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场, 由卡耐基梅隆大学(CMU)开发的名为 Libratus 的人工智能系统将与人类顶级职业德州扑克玩家进行 20 万美元的比赛 。然而 CMU 并不是唯一一个在研究如何让人工智能学习玩扑克牌的地方,近日,加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究者联合发表了一篇论文,表示其人工智能已经在无限制扑克(No-Limit Poker)游戏上达到了专家级的水平。点击阅读原文可下载该论文。


摘要


近些年来,人工智能领域出现了很多突破,其中游戏往往被用作重要的里程碑。过去实现那些成功的游戏的一个常见的特征是它们都涉及到玩家之间的信息对称,即所有的玩家都获取了相同的信息。然而和游戏相比,这种完美信息(perfect information)的性质在真实世界问题中却少见得多。扑克是一个典型的不完美信息(imperfect information)游戏,而且其一直以来都是人工智能领域内的一个难题。在这篇论文中,我们介绍了 DeepStack,这是一种用于扑克这样的不完美信息环境的新算法。它结合了回归推理来处理信息不对称性,还结合了分解(decomposition)来将计算集中到相关的决策上,以及一种形式的关于任意牌的直觉——该直觉可以使用深度学习进行自我玩牌而自动学习到。在一项涉及到数十位参与者和 44000 手扑克的研究中,DeepStack 成为了世界上第一个在一对一无限制德州扑克(heads-up no-limit Texas hold'em)上击败了职业扑克玩家的计算机程序。此外,我们还表明:和已经被人亲睐了十多年的抽象范式(abstraction paradigm)相比,这种方法能够极大地减少最糟糕情况的 exploitability 值。








请到「今天看啥」查看全文