专栏名称: 雷峰网

中国智能硬件第一媒体

重磅 | 阿里推出多智能体双向协调网络BicNet，玩《星际争霸》堪比人类

雷峰网 · 公众号 · 科技媒体 · 2017-04-03 22:34

正文

过去十年中，人工智能取得了长足的进步，在图像和语音识别上已经在某种程度上超越了人类。而通过反馈奖励，单个的AI智能体也能在雅达利这样的视频游戏和围棋中战胜人类。

但人类真正的智能还包括了社会和集体智能，这也是实现通用智能必不可少的。就像虽然单个蚂蚁的智能有限，但通过协作它们能狩猎，能筑巢，能发动战争。毫无疑问，人工智能的下一个挑战就是让大规模的AI智能体学习人类水平的协作与竞争。

协作的一个例子就是星际这样的即时战略游戏。雷锋网消息，最近阿里巴巴与伦敦大学的研究人员们，就在一篇论文中展示了如何用星际争霸作为测试场景，让智能体协同工作，在多对一和多对多中打败敌人。

掩护攻击

这项研究主要关注星际中的微管理任务，每个玩家控制自己的单位，在不同的地形条件下歼灭对手。星际这样的游戏对计算机来说可能是最困难的，因为它们的复杂程度比围棋要高得多。这种大型多智能体系统学习面临的主要挑战是，参数空间会随着参与人数的增加而呈指数级增长。

研究人员让多智能体把星际中的战斗当作零和随机游戏来学习。为了形成可扩展且有效的通讯协议，研究者引入了一个多智能体双向协调网络BiCNet，智能体可以通过它来交流。另外，研究中还引入了动态分组和参数共享的概念，来解决扩展性问题。

边打边跑策略

BiCNet可以处理不同地形下的不同类型的战斗，且对战时双方都有不同数量的AI智能体。

分析显示，在没有任何诸如人类示范或标签数据的监督时，BiCNet也能学习各类协调策略，而这些策略与经验丰富的玩家所展现出来的很相似，比如在不引发冲突的情况下移动，边打边跑等基本策略，以及掩护攻击与适度集中火力等高级技巧。

另外，BiCNet还可以轻易适应异构智能体任务。在实验中，研究者根据不同的场景对网络进行了评估，发现它表现优异，在大规模现实应用中有潜在价值。

研究中还发现，指定的奖励与学习策略之间存在很强的相关性。研究人员计划进一步研究这种关系，研究策略如何在智能体网络中传递，以及是否会出现特定的语言。另外，双方都通过深度多智能体模型来操作时，纳什均衡的的探讨也很有意义。

论文阅读： https://arxiv.org/pdf/1703.10069.pdf

点击关键词可查看相关历史文章

● ● ●

近期热门

小蓝单车李刚：滴滴带给我的绝望已经过去

Uber 乱象大揭秘：自动驾驶团队已陷入 “小型内战”

和平分手？你根本不知道吴恩达在百度经历了什么

扬名 UEC 杯，腾讯围棋 AI“绝艺” 夺冠之路全回顾！

重磅 | 撕掉电商标签，还原阿里 “NASA” 的真实意图

从供应链的角度谈谈，我们真的能抵制韩货吗？

请到「今天看啥」查看全文

推荐文章

青岛日报 · 目标：2030年前中国人首次登陆月球！最新进展来了→

昨天

青岛日报 · 目标：2030年前中国人首次登陆月球！最新进展来了→

昨天

新浪科技 · 【消息称#比亚迪将落地1000V高压超充平台#，本月中旬发布】据-20250303091000

昨天

雷峰网 · DeepSeek理论利润率高达545%！引大模型创业者线上互怼；字节商业化大调整，千川并入电商板块；官方回应极星汽车退出中国市场

昨天

新浪科技 · 【#GPT4.5定价为何那么贵#】新模型周周见，Anthropi-20250301143621

3 天前

DeepTech深科技 · 70年前杨振宁所提概念迎新进展：斯坦福团队在光子体系实现非阿贝尔晶格规范场，或催生全新光学器件

3 天前

爱范儿 · 除了中国登顶 iOS 收入第一，2016 年的移动应用市场还发生了这些

8 年前

管理智慧 · 打工者思维的人，未来终将被淘汰

8 年前

Python新手营 · 曾梦想仗剑走天涯

7 年前

早安晚安心语 · 女人最应该扔掉的三样东西

7 年前

最爱大北京 · 香港女特首林郑月娥：不聊天的女人才会成功

7 年前