专栏名称: 游戏研究社
每天发点儿有意思的内容,基本都和游戏有关。
目录
相关文章推荐
叶子猪游戏网  ·  打了一版本的BUG,暴雪将修复惩戒骑卡手问题 ... ·  4 天前  
51好读  ›  专栏  ›  游戏研究社

你能在家里训练AI打星际2了,目的当然是为了战胜人类

游戏研究社  · 公众号  · 游戏  · 2017-08-11 23:58

正文


难道人类以后打游戏也要输给AI了?


在去年的暴雪嘉年华上,暴雪曾宣布与谷歌合作,在《星际争霸2》中引入机器学习,进行人工智能研究。

 

现在,双方终于在网上放出了工具包,玩家可以下载用来在游戏中训练AI。谷歌希望在全球数十万星际玩家的帮助下,最终能研发出一个在同等条件下战胜人类的游戏AI。

 

 


为何要训练AI玩游戏

 

在国际象棋和围棋领域,人类均已经负于AI对手,下一步该轮到游戏领域了。之前,包括星际系列在内的即时战略游戏中其实都早已有不同复杂程度的AI在运作,人类也可以挑战AI选手,只不过这些AI大都是简单通过开发者预先设置好的程序。

 

由于这些AI的智能程度并不高,他们往往需要通过直接访问后台数据等“作弊”方式才能勉强与人类同台竞技,这样对双方其实并不公平。

 

况且战胜一个“弱智”的AI选手,对于玩家来说所获的成就感也有限,真正独孤求败的高手,都是与对手惺惺相惜的。

 

而一个成熟的AI,需要通过大规模的机器学习以获取大数据,因此谷歌旗下的AI部门DeepMind决定与暴雪合作,希望通过全世界星际玩家的共同努力,训练出一只可以“真正”与人类同台竞技的阿尔法狗。

 

至于这样做的意义,DeepMind科学家,西班牙前顶尖星际玩家Oriol Vinyals表示,相比国际象棋和围棋,星际更接近“复杂的真实世界”。

 

能玩星际的AI需要有效地利用记忆能力,能够进行长期战略规划,并根据新的信息不断做出调整。如果谷歌的AI系统能掌握如此复杂多变的技能,最终这些技术将被用于回馈现实世界。

 


为何是星际?

 

作为已经诞生快20年的游戏,星际系列是人工智能和机器学习领域研究的理想环境:首先,即时战略游戏具有复杂和多样性的特质,每场比赛都有不止一种取胜的方法,玩家必须同时兼顾采集和运用资源,指挥军事单位及部署防御等,并在其中取得一个平衡。

 

其次,一局游戏的时间在几分钟到一个小时之间,这意味着玩家在早期采取的行动将很快看到结果;同时,游戏中的地图并非一开始就全开,玩家必须猜测对手的位置、状态和行动,并制定自己的计划。而围棋则可以看到棋盘上的全部落子,AI获取与处理数据相对要容易得多。

 

最后,游戏每天在战网上还有大量的玩家在进行对战,这样可以保证有海量的回放数据以供AI学习和模仿,也给AI提供了不同类型的真实人类对手,还可以用来进行序列预测和长期记忆领域的研究。

 

之前谷歌也曾经用雅达利的游戏来进行机器学习,与雅达利游戏相比,星际的动作无疑更加的复杂:雅达利游戏只有上下左右等十种左右的基本动作,而星际的基本动作就有300多种,这些基本动作还可以进一步进行修改和扩充。据统计,在一块84x84像素大小的屏幕上,就可能会有超过一亿种动作。

 

一个简单操作动作的逐步拆解分析

 

围棋棋面的全部有效位置数目是1后面跟170个零,研究人员称,星际的复杂程度要比围棋高很多,至少要再增加100个零。


 

怎样来训练AI

 

研究人员将《星际争霸2》中诸如建造建筑、采集资源、移动地图等动作都分解成了不同的小块,希望通过这种方式收集全球玩家在游戏中所做出的不同行为,再将数据进行细分比较,并最终获得赢得游戏的秘诀组合。

 

训练AI学习游戏中的移动、采矿及建造兵营等特定动作

 

当前,在这些单独的小块中,AI都处理得不错,但一旦涉及到完整的游戏,训练过的AI甚至还远不及游戏内置AI,就更别提人类了。这说明,AI玩星际要想达到真正人类的水平,还有很长一段路要走。

 

AI眼中的《星际争霸2》

 

研究人员还发现,AI在训练前后的行为有天壤之别:经过训练之后的AI会高效的采取更有意义的行动:

 

训练前后对比

 

但AI并非通过简单学习和模仿人类选手的方式来玩星际,研究人员会针对AI的优势来开发新的游戏风格,例如同时进行多个任务。

 

曾为《星际争霸》开发过LetaBot对战机器人程序的Martin Rooijackers表示,AI玩星际的方式与人类选手不同,毕竟怀特兄弟也没通过模仿鸟类来发明飞机。

 

至于AI预计何时会在星际里击败人类,有专家预测是五年。

 


工具包怎么用

 

双方这次放出的工具包名为SC2LE,其中包括由暴雪提供的机器学习接口和谷歌提供的开源工具PySC2和技术白皮书。

 

作为一名普通玩家,你只需下载这个工具包并运行,就能和全球其他玩家一起共同参与到游戏AI培训项目中,在游戏中提供反馈数据,协助AI的学习和优化。

 

机器学习接口包括脚本和基于图像的AI和接口等内容,同时提供文档、样本代码及Bot机器人。该接口支持离线AI对战,并包含1v1天梯竞技回放供AI学习,暴雪现已提供了6.5万局回放数据,几周后将增加至50万局。

 

暴雪承诺,收集的数据将充分保护玩家的个人隐私。同时也强调,需要依靠玩家的创造力、才智和努力,才能达成最终的研究成果。

 


AI争议

 

这并非游戏首次与科研项目合作,之前索尼的PS3主机,由于采用了IBM Cell处理器和可安装第三方系统,可以被串联起来组成计算机集群。

 

索尼甚至联合斯坦福大学推出了分布式计算项目,让全球PS3玩家们的主机贡献计算力量,用以攻克医学难题或是寻找外星生命。

 

只不过这次的研究项目有一些不同:人们对AI的争议从来就没断过,前不久特斯拉创始人马斯克就在“AI会不会终结人类文明”问题上与Facebook创始人扎克伯格发生了争论,马斯克认为AI将威胁到人类,而扎克伯格则称马斯克的言论“非常不负责任”。

 

喜欢刊登八卦新闻的英国《太阳报》也跳出来火上浇油:他们报道称Facebook聊天AI已经发明了自己的语言,消息也在网上引发了不小的恐慌,不过最后被证实只是虚惊一场。

 

这样来想,当某一天一个能真正战胜人类的游戏AI出现后,你会不会觉得自己帮助打开了一个潘多拉魔盒呢? 



关注公众号“游戏研究社”后发送以下关键词,可看到更多精彩内容:


神考据 | 科普 | 街机 | 任天堂 | 社长说 | 励志 | FC | 红白机 | 长鼻君 | 黄油 | 魔兽 | 塞尔达 | 巫师 | VR | 守望先锋 | 精灵宝可梦 | 阴阳师 | 行业 | 盘点 | 剧场 | 老四强 | 独翼神龙