专栏名称: 创新工场
搭建创新工场和创业者的沟通交流平台,在这里,您可以学习创业相关的法务、市场、财务、HR等各个业务领域所需的知识干货,还有机会参与到工场举办的创业者培训、沙龙和其他各类活动中。
目录
相关文章推荐
低维 昂维  ·  复旦大学晏湖根团队Science: ... ·  2 天前  
低维 昂维  ·  复旦大学晏湖根团队Science: ... ·  2 天前  
科技日报  ·  新一代人造太阳取得关键进展! ·  3 天前  
科技日报  ·  新一代人造太阳取得关键进展! ·  3 天前  
字节跳动技术团队  ·  BlockFramework —— ... ·  4 天前  
字节跳动技术团队  ·  BlockFramework —— ... ·  4 天前  
51好读  ›  专栏  ›  创新工场

50小时 36000手牌 | 龙之队惜败冷扑大师

创新工场  · 公众号  · 科技创业  · 2017-04-10 15:16

正文

备受瞩目的“冷扑大师V.S.中国龙之队——人机扑克巅峰表演赛”今日中午刚刚完成的最后一局赛程,结束了它的亚洲首秀。经过5天赛事,冷扑大师最终以792,327总记分牌的战绩获胜,200万奖励归属冷扑大师。




李开复:不完美信息AI技术获得验证,人机对弈已无悬念


本次比赛发起人、创新工场CEO、人工智能工程院院长李开复博士表示:


透过冷扑大师和龙之队表演赛的对战结果,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。下一阶段我更关注的是,AI真正进入到我们的生活和商业领域会引发的一连串大地震。


AI处理人机对弈的信息模式可大致分为完美信息、不完美信息两类,人机棋牌对弈中的围棋和扑克正是这两类的代表,AI经过这两类赛事胜过人类已经获得验证。


创新工场已在AI领域积极布局,核心投资业务将有半数重仓人工智能,孵化方面则成立了创新工场人工智能工程院,由李开复博士亲自带队,与来自世界顶级机构的著名工程师和顶尖科学家共同探索技术、产品、商业价值和数据的结合,致力于快速推进人工智能在商业领域与科学研究的发展和连结,实现人工智能科研成果向产业实践的高效转化。



这次来到中国的冷扑大师V.S.中国龙之队的人机扑克巅峰表演赛,正是和李开复博士母校、全球计算机及人工智能领域顶尖的卡内基梅隆大学携手合作的结果。


AI有读心术

 

中国龙之队队长杜悦在谈到五天的比赛感想时表示,“人工智能在对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,不得不承认冷扑大师很多手牌打得令人拍案叫绝”。


龙之队杜悅、许朝军、张淮、童舟、朱亚希、王天健共六位人类牌手坚持了5天、每天10小时的心志、体能、压力三重挑战,顺利完成表演赛约定共计36,000手牌。


其中杜悦、许朝军、张淮三人当年均为清华大学计算机主修的高材生,相对于其他职业德扑玩家更为了解人工智能背后的技术原理,在表演赛进程当中,龙之队牌手亲手记录手牌过程,笔记冷扑大师的出牌套路,每天每场复盘总结,可谓集合真人团队集体智慧来动态研拟作战计划,对扑克选手是一种非常难得的团队智力磨练。


龙之队成员许朝军也说出了与一月美国匹兹堡之战中美国玩家同样的感受:“AI有读心术”。

 

冷扑大师发明人、卡内基梅隆大学Tuomas Sandholm教授则解密了AI德扑背后的技术奥秘:


扑克在几十年来一直是人工智能和博弈论中的一个具有高挑战性的问题。作为带着隐藏底牌的“不完美信息”游戏,扑克对AI来说,具有国际象棋和围棋游戏中未曾出现的信息障碍。


今年1月,人工智能Libratus在有超过10 ^ 160个决策点的单挑无限德州扑克比赛中打败六位顶尖专业牌手获得了成功和认可,这次海南表演赛Libratus的中国兄弟“冷扑大师”对阵六位强大的中国牌手,积累了显著的领先优势。


冷扑大师开发者Tuomas Sandholm教授、博士生Noam Brown与龙之队选手杜悦、朱亚希


Libratus和冷扑大师在三个主要技术模块中都使用了新的算法,包括比赛前采用近于纳什均衡策略的计算(Nash Equilibrium strategies)、每手牌中运用终结解决方案(Endgame Solving)、以及根据对手能被识别和利用的漏洞,持续优化战略,打得更为趋近平衡。


这个算法模型不限扑克,可以应用在各个真实生活和商业应用领域,应对各种需要解决不完美信息的战略性推理场景。

 

冷扑大师相对于AlphaGo更高明之处在于冷扑大师不需要提前背会大量棋谱,也不局限于在公开的完美信息场景中进行运算,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,并通过博弈论来衡量和选取最优策略,这也是冷扑大师在后程越来越凶悍,让人类玩家难以抵挡的原因之一。


在五天的巅峰表演赛中,冷扑大师和中国龙之队双方共完成了36,000手牌,每天鏖战10个小时,全赛程中牌手两两配对,计算机采用复式对称发牌来降低运气等偶然因素。


以单日表现来看,比赛首日中国龙之队与冷扑大师的积分差距为65,137记分牌,第二日人类落入低谷差距347,565记分牌、第三日差距233,874记分牌、第四日人机大幅拉近为98,408记分牌、完赛日47,343记分牌,五天下来冷扑大师累计赢得792,327记分牌数,平均22.0每百手损失大盲。


李开复:靠几个小伙伴就能在AI领域打天下的时代过去了

 

李开复博士认为,人工智能发展势不可挡——“未来的人工智能领域不再是几个小伙伴就可以打天下的时代了,而是需要顶尖的人工智能科学家、海量数据、强大的运算能力、以及清晰行业应用几大闭环。创新工场在AI领域的投资布局无疑将帮到这样的创业团队成功。


“我希望冷扑大师对战龙之队这场人工智能的里程碑事件将推动人们对于人工智能的认知。人机扑克对战中,我们看到了在尔虞我诈、概率不确定、非完美信息需要推理和情商的游戏里,机器一样可以获胜,而类似的场景在真实世界中比比皆是”。


人工智能已经不再只和AlphaGo对标,人工智能已从不完美信息的处理,进步到对不完美信息海量信息运算,并具备了推理和学习能力。


创新工场CEO李开复博士亲临现场观战


李开复强调:“我期待下一个更加高明的AI大师级应用登场,而我更愿意相信,这些应用会来自优秀的年轻创业者,而不是诸如BAT等的科技巨头黑洞。

 

在龙之队选手结束与AI的巅峰较量后,“冷扑大师名人体验赛”旋即展开,该环节赛事共组建六支战队进行对战,来自科技圈、投资圈、媒体圈等逾30位名人嘉宾参与其中:创新工场CEO李开复、丰厚资本创始合伙人暨春光里创始人杨守彬、知名电视主持人许戈辉、金沙江创投董事总经理丁健、天神娱乐董事长朱晔、极客公园创始人张鹏、Xtecher创始人戚宗超、知名媒体人阳淼等嘉宾都将亲自上机感受与人工智能对打扑克的前卫挑战。


拓展阅读

深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB
李开复《人工智能》新书抢鲜读: 最Top的德扑大师也会被AI蒙骗

在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败

人机扑克对阵前,CMU计算机学院院长访华解析最新AI谈判技术

德扑人机大战Day4战况 | 龙之队绝地反击 李开复观战