专栏名称: 聚创大咖汇
专注资源对接+网赚项目开发,持续分享最新网赚项目,引流/变现技巧以及其他生财术道。
目录
相关文章推荐
Python开发者  ·  成人玩偶 + ... ·  2 天前  
Python爱好者社区  ·  付费上班终于成为了现实。 ·  昨天  
91运营网  ·  如何用DeepSeek做运营? ·  2 天前  
51好读  ›  专栏  ›  聚创大咖汇

腾讯AI击败王者荣耀职业队,一天训练量为人类440年

聚创大咖汇  · 公众号  ·  · 2019-08-04 22:35

正文


昨晚吉隆坡,王者荣耀最高规格电竞赛事“ 世界冠军杯半决赛 ”正在进行,期间有一场特殊的对战双方:


  • 五位职业选手组成的联队

  • 腾讯王者荣耀AI“绝悟”


在这场5v5的对决中,思路与人类迥异的AI战队耗时16分15秒,团灭电竞职业联队,推掉全部9塔和高地水晶。


这意味着,腾讯AI绝悟的能力,已经精进到王者荣耀电竞职业水平。当然了,对非职业玩家更是砍瓜切菜。


同日上海的ChinaJoy,绝悟向顶级业余玩家开放为期四天的1v1体验测试。首日的504场测试中,绝悟测试胜率为99.8%,仅输1场 (对方为王者荣耀国服第一后羿)


首次击败职业联队



在这场比赛中,五位电竞职业高手组成赛区联队。他们选择的阵容是:



腾讯AI绝悟 (Wukong) 选择的阵容是:



开局时,绝悟并没有选择传统人类对线走位的策略,而是首先放弃上路,由双C位英雄虞姬和王昭君一起清理中路的第一波兵线,压制敌方中辅,之后又转上路压制曹操血线。



这种分配,没有经济倾斜。两人吃线,经济收益最大化,每个人都能获得80%。现场解说表示,AI对中路抢线权理解的很透彻。


开局2分钟


绝悟率先推掉了联队的上路1塔,经济优势扩大到5.1k:4.3k。


开局2分半


电竞联队的曹操,击杀绝悟AI虞姬拿下一血,双方经济打平,同为6.4k。



4分24秒


绝悟四人追击娜可露露,达摩一脚将娜可露露反踢入AI中群殴,最终达摩拿下AI首个人头。



这段时间,绝悟的雅典娜则一直单带,而另外四个AI一直在抱团。


7分20秒


雅典娜反蓝成功,此时绝悟拿下3塔4人头20.9k经济,电竞联队拿下2塔3人头19.7k经济。


现场解说认为绝悟的效率和团队协作方面,都表现出色。“在4-1转线方面,几乎是做得完美。”


双方随即进入一段激烈交锋的阶段。


8分48秒


绝悟一波团战0换2,并在全员残血的情况下,主动追杀职业联队血量健康的曹操。不过绝悟也损失了血量最少的达摩,1换1。


接着绝悟顺势开主宰。随后复活的职业玩家赶来,团灭了绝悟战队,并拔掉中路2塔、反蓝成功。


现场解说指出,AI的策略是“不想回家,打到弹尽粮绝。”这种方法,让带线效率更高。


9分48秒


  • 绝悟拿下5塔8人头28.2k经济

  • 赛区联队拿下4塔8人头28.9k经济


10分25秒


绝悟连续拿下4个人头。 其中包括电竞 联队曹操在上路被残血的AI虞姬反杀。 展现出绝悟1v1时良好的即时策略能力。



11分30秒


绝悟推掉电竞联队的中路高地塔。


然而,电竞联队的曹操绕后,紧接着来了一拨反打,收掉绝悟四个人头,AI战队仅剩雅典娜仓皇脱逃。


但是,电竞联队这一时间没能继续推塔,也没有拿下主宰。


14分钟


反让绝悟击杀主宰。此时战况如下:


  • 绝悟拿下7塔13人头45.1k经济

  • 电竞联队拿下6塔12人头43.3k经济


紧接着,绝悟开始不断的清理各路兵线。


15分20秒


绝悟四人上路抱团,在主宰先锋的支持下,强开高地塔。


双方爆发激烈团战,在AI王昭君和牛魔大招的加持下,绝悟最终打出一波1换5,赛区联队团灭。



然而,对手团灭+两条主宰先锋上高地的情况下,绝悟却没有选择直接推水晶,而是秀了一波操作……


绝悟四人,在没有 兵线的支持下 ,以轮流抗塔的方式,推掉了还有三分之二血量的最后一座高地塔。


现场解说高声喊:“太绝了。”



16分15秒


绝悟推掉水晶,战胜了电竞职业联队。


最终战况:


  • 绝悟拿下9塔18人头56.2k经济

  • 赛区联队6塔13人头48.0k经济




绝悟之路



绝悟,是腾讯AI Lab和与王者荣耀共同探索的前沿研究项目:策略协作型AI。

绝悟这个名字,寓意“绝佳领悟力”。 这个AI的研发始于2017年12月。

2018年12月,绝悟5v5对阵《王者荣耀》王者段位人类玩家,大战250局,拿下48%的胜率。

现在,绝悟已经超越王者段位水准,达到职业电竞选手的层次。

这次在吉隆坡和上海发威的绝悟版本,建立了基于“ 观察-行动-奖励 ”的深度强化学习模型,无需人类数据,从白板开始学习,让AI自己与自己对战。

AI一天的训练强度,已经高达了人类440年的训练强度。


据腾讯介绍,AI从0到1摸索成功经验,勤学苦练,既学会了如何站位、打野、辅助保护和躲避伤害等游戏常识。 而且,AI还探索出了不同于人类常规做法的全新策略。

绝悟的研发团队使用零和奖惩机制让AI能最大化团队利益,使其打法果断,有舍有得。

游戏中测试的难点,是AI要在不完全信息、高度复杂度的情况作出复杂快速的决策。

在庞大且信息不完备的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面,面临着大量、不间断、即时的选择,这带来了极为复杂的局面,预计有高达1020000种操作可能性,而整个宇宙原子总数也只有1080。

如果AI能在如此复杂的环境中,学会人一样实时感知、分析、理解、推理、决策到行动,就有可能在多变、复杂的真实环境中发挥更大作用。

此前,腾讯另一个AI绝艺,在围棋赛场上大杀四方。当然对人工智能来说,王者荣耀是一个比围棋复杂太多的难题。


当然了,前期英雄该去哪儿,后期游戏进行到了什么阶段, 知道了该去哪还不够,要想上王者,还得会判断局势,调整策略。

这就是时期层的工作了,想上王者的朋友, 可以点击左下角“ 阅读原文 ”来学习感受这个模型的熏陶,控制每个英雄的智能体,既能独立做出决策又不忘与队友沟通,让你成为顶尖选手。

最后,视频对战全程如下,对战从3分5 5秒开始:

完)
文/量子位










请到「今天看啥」查看全文