编者按:小编出生于90年,是80后和90后的交界处。我觉得,我们这一代有一个很重要的主题,那就是游戏。这是一个奇妙的东西,我依稀记得我人生中第一次走神就是在奥数小班上想着几天前玩的“帝国时代I”的场景。的确,游戏确实会让人着迷,甚至疯狂,但是水能载舟亦可赛艇,游戏也是有锻炼脑力和反应能力的作用。
至少小编这么想,那时候只会死读书的我,还觉得会打游戏的同学才是聪明的人,哈哈。其实,游戏中也是有规律和套路的,一旦找到了这些规律,充分利用,游戏自然就打得好了。这和做事、做学问都是很类似的,而且打游戏的人都有一个特质,那就是“执着”。一旦一个人懂得解决问题的方法,再加上执着,就能成事。回到今天的主题,训练人工智能。
提到谷歌的人工智能团队DeepMind,相信大家都知道他们开发的AlphaGo。这是一个电脑程序,曾经在今年 3 月份在棋盘上战胜了韩国围棋选手李世乭。如今,DeepMind 团队又和游戏巨头暴雪(Bilzzard)公司合作,选用游戏“星际争霸II(StarCraft II)”开发人工智能中的深度学习。
2016年的暴雪嘉年华人潮涌动,但当这一份声明发布的时候,全场鸦雀无声。而这无疑是当天大家知道的最震撼的消息了。
当天,暴雪公司其实还发布了旗下游戏的新版本。诸如“炉石传说(Hearthstone)”、“风暴英雄(Heroes of the Storm)”、“守望先锋(Overwatch)”以及“暗黑破坏神三(Diablo III)”都公布了自己的新角色或者新内容,这也引起了许多玩家兴奋滴尖叫。
相比之下,谷歌DeepMind将和暴雪合作的消息却引发了更大的骚动。大家熟知DeepMind是一家开发前沿人工智能技术的公司,此次合作将以“星际争霸II”为桥梁,研究人工智能技术。
说白了,就是教人工智能打游戏!那么,为什么唯独选中了“星际争霸II”呢?
作为暴雪主打的即时战略类游戏,星际争霸II是时下最具一对一竞技性质的游戏了。游戏中的战争迷雾、操作空间、经济运营、及时性游戏、大局观、三个不同种族的互相对抗的特点,比象棋围棋更加接近现实,也更具复杂度。
如果此项研究顺利进行,其实反过来,职业选手也会受益——一个强大的陪练(小编又想起当年被疯狂的电脑虐翻的往事)。而因此“训练”出的人工智能显然能完成更加复杂的任务,也能运用于我们日常生活中。就正如DeepMind一直想涉足的医疗保健行业,这对于游戏圈以外的人也是相当的好处。
实际上,人工智能在游戏中的应用已经有一段历史了。星际争霸II的首席制作人克里斯·西加提也指出,DeepMind开发的人工智能并不是首个“玩”暴雪出品的即时战略游戏的非人类玩家。
现行的游戏中,大都是脚本型的人工智能。通常由一个设计团队开发,其中还有设计人员以及软件工程师。
他们首先将游戏的套路理解,再由自己的专业技能转化为脚本,这个游戏脚本也只是发出应对预设情况的指令,例如:如果采集了X吨资源,那么在Z单位上花费Y吨——这是即时战略类游戏最常见的脚本AI了,这也是为什么这些脚本AI大多只能采取暴兵狂魔战术的原因。
星际争霸II人族基地,玩家正在考虑建筑的地点
对于这些脚本AI而言,西加提表示,游戏中的AI还算设计的比较精密,跟它们对战也比较有意思。当然,游戏总是充满随机性和选择性的。在游戏中,AI会自发地扩展自己的地盘、收集资源还有那些星际争霸II中最基本的操作。但是,它们是脚本化的,很容易被预测。除非我们设置作弊,这种AI是不可能战胜人类的。
对于星际争霸II来说,最强的玩家很轻易就能打败游戏中的AI。那么,DeepMind的目标就是开发一个AI,它能以人类的方式玩游戏。
当然,最好的情况还是能够战胜人类最强的玩家。如果这个目标能够达成,这也是对深度学习的一大拓宽。
总而言之,DeepMind之前在策略游戏方面也还是小有成就的,这又要提到DeepMind开发的AlphaGo以4-1战胜韩国棋手李世乭的事情。这也完成了人工智能的一大夙愿——之前从未有人工智能战胜人类顶尖围棋选手的先例。
这不仅仅是一个游戏
奥里奥尔·温雅思是DeepMind团队的一名研发科学家。他表示,星际争霸II能帮助人工智能技术大步向前走。
相比之前的棋类游戏,星际争霸II要复杂得多——游戏中的“单位”都不是静止的了,并且玩家之间的行动已经没有“回合制”这一概念了。
在这种环境下“训练”人工智能,发展一定是前所未有的。显然,奥里奥尔对此也十分激动,他表示,星际争霸II的复杂度能帮助DeepMind测试其复杂的算法,而这也是数年前就想去解决的问题。
然而,星际争霸II的复杂程度远超想象。游戏中赢得比赛的关键点都是隐藏的,需要玩家去摸索。例如,在游戏中,玩家需要开发自己的地盘,以及建造建筑和单位,同时也需要探索地图来确认敌方的位置。
脚本AI能将游戏单位的行动转化为数据流,那么为了达到对人工智能的“训练”目的,这样的数据流也应该被隐藏。
谈及游戏的难点,温雅思表示,与其他即时策略游戏一样,星际争霸II还是比较复杂的。游戏中会将一些单位隐藏,而且游戏之初玩家并不知道敌人的方位。
当然,简而言之,这就是一个收集资源、分配资源、造建筑、造兵,然后征服敌人的游戏。难点在于,玩家如何利用自己的操作和经验来胜过敌人。当然,这样的复杂程度对于人工智能来说,既是机遇也是挑战。
温雅思说,“DeepMind将会竭尽全力来克服遇到的难题。也许我们的研究不会立刻成功,我们会步步为营,稳扎稳打地来完成研究。另外,我们欢迎任何人参与到我们的研究,集思广益是很有帮助的。”
复杂的星际争霸II对人工智能技术的发展来说,是具有挑战性的机遇
由此也可以见得,暴雪与 DeepMind 之间的合作并不是封闭式的,正如温雅思在暴雪嘉年华上的合作声明中所提及,星际争霸II的人工智能研究是向任何开发者、民间高手以及玩家开放的。
DeepMind更是从全世界范围征集点子,毕竟这对于这个团队还算是一个巨大的挑战。应用程序编程接口(API)将会于2017年第一季度以游戏拓展包的形式上线,并是作为免费试玩版的一部分。但温雅思表示,还有很多事情在API上线之前需要处理。
学习的过程
西加提说:“这真是一个巨大的挑战。有很多问题亟待解决,并且是一系列的。在深度学习中,一个提供数据和信息的系统是必须的,就和我们学习一样,也要有知识的摄取。”
所以,一旦开发环境确定了,人工智能将会引入其中,而学习过程就开始了。为了完成学习的回路,DeepMind团队需要做的就是确保人工智能能够从观察中学习,并在开发环境中输出指令。
即使这个学习回路的基础框架之前已经用过,但星际争霸II会将其变得更加复杂。这比仅仅控制摇杆向左向右或是在19X19的围棋盘上面玩围棋要难得多。
关于信息的提取,西加提表示,之前游戏中的人工智能能够获得游戏中的数据流。所以,不管这场游戏是玩家对阵AI还是玩家之间的战斗,所有游戏中的信息将会一览无遗,你将能够看到玩家看不到的单位,无论是在战争迷雾中还是隐身的单位,因为数据将会告知他们在那里。
那么DeepMind现在做的API在探索地图之前是看不到这些数据的。在此环境中,游戏中的数据将以视觉形式展现,所以这就保证了DeepMind能训练人工智能像人类那样玩游戏。最令人兴奋的地方就在于未来的神经网络和深度学习,而且并不明确这将把人工智能带向何方。
如果成功,DeepMind和暴雪将会收获颇丰。在游戏市场,暴雪能凭借此项目为星际争霸II提升游戏体验。想象一下,能够跟一个无法预测的人工智能对战,将是一件十分有意思的事——赢下游戏的成就感跟之前是没法比的。
也就说,这种非脚本型的游戏AI,能够通过观察人类玩家学习游戏的策略。即使它的水平并没有达到人类玩家的水平,它还是提供了一些变化和新的挑战。
无疑,这样的深度学习能够使得人工智能掌握游戏的套路、玩家经常犯的错误以及胜利条件,即能够判定一方玩家已经在游戏中打败了另一放玩家。
如此学习,人工智能最终会掌握些什么呢?最终,它将能判断这是不是一个好的策略。虽然这个目标也不知道能不能达到,但是梦想还是要有的吧,万一实现了呢。
如果实现了,这无疑将成为辅助玩家决策的一个利器,它也许会评判‘现在建造某某单位是最佳时机’。而且,这也将是游戏初学者的福音,它将能提供初学者游戏的指导,以及介绍游戏的微妙之处。
人工智能能充当电子竞技玩家的陪练,备战各大游戏的赛事
当然,对DeepMind而言,最大的意义就是将算法测试结果运用于实际之中。最近的例子就是今年 7 月,DeepMind团队的人工智能将谷歌公司数据中心的账单减少了40%。该人工智能首先被置于能学习的环境,然后使得这个系统的效率有了显著提升。而且,谷歌本想用可再生能源给自己的数据中心供能,还未实施之前,DeepMind就已经将其能耗和成本大大降低了。
对这样的成绩,温思雅表示,这就和玩游戏一样。人工智能先是查看房间里面的温度分布,然后做出最优方案来给数据中心降温。当然,游戏还是比这个要复杂很多,DeepMind的目标就是在不降低其功能的前提下减少人工智能的处理时间。
但这并不容易,因为开发环境被设计成通用的之后,其中可能会有很多并行运行的游戏。当然,游戏能测试算法,也能提高算法的效率。一旦你从中将数据取出,广阔的应用就在向你招手了,而这也将成为人工智能技术发展和研究的重要时刻。
说起来大家可能会觉得奇怪,暴雪和DeepMind在星际争霸II上的合作也许是星际争霸游戏系列光辉历史上最后一个节点了。
可以说,星际争霸第一代游戏带动了全球电子竞技行业的兴起。而现在,星际争霸正在帮助人工智能的发展。这也是西加提没有想到的,他经历了十几年星际争霸的发展历史,他曾经在星际争霸第一代游戏的开发团队中担任工作。
那么星际争霸II该何去何从呢?谁也说不清楚。
但没准不久以后,就能看见DeepMind开发的AlphaGo与星际争霸II的职业选手同台竞技,到时候一定会是机场精彩的对局。
不过,小编还是想看见AlphaGo也能在“魔兽争霸III”的战场上和人皇Sky、三蛋、兽王狗拉皮、小胖Ted还有Moon神打几场。也算是老玩家对deadgame的一种缅怀吧。
编辑:杨一鸣
参考:http://arstechnica.com/gaming/2016/11/starcraft-2-google-deepmind-ai/
本周精选:
2076年的人类世界,2万字长文畅想|《新科学家》震撼发布
招聘
编辑、视觉设计、实习生(编译)
地点:北京
联系:[email protected]
MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。
分享至朋友圈才是义举