专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

DeepMind发布新论文：嘈杂网络让智能体成为游戏大咖

量子位 · 公众号 · AI · 2017-07-05 12:32

正文

安妮编译自 ArXiv
量子位出品 | 公众号 QbitAI

近日，谷歌DeepMind团队的Meire Fortunato、Mohammad Gheshlaghi Azar、Bilal Piot等12人在ArXiv上发表了一篇新论文，主要探索了嘈杂网络(Noisy Networks, NoisyNet)以及在游戏中应用的表现。

量子位将论文中部分内容整理编译，与大家分享。

论文摘要

本文提出了NoisyNet，一种权重中增加了参数噪声的深度强化学习智能体，也证明了这种智能体策略的诱导随机性可被用来辅助有效探索。在NoisyNet中，噪声参数随着剩余网络权重一起学习梯度下降。

研究人员发现，用NoisyNet替代A3C、DQN、Dueling等算法智能体中的传统启发式探索，在多数Atari游戏中得分更高，一些情况下它也会胜过人类的表现，并且几乎没有额外的计算成本。

游戏大咖

研究人员用Atari的57个游戏对NoisyNet进行测试，并对比A3C、DQN和Dueling三种智能体的NoisyNet变体和基线对比结果。

△ 三种智能体的NoisyNet变体和基线的表现性能比较

在上面的图中，横轴罗列了57个游戏，纵轴显示了表现性能的增长幅度，而图中能显示出来的最大增长幅度为250%。

值得注意的是，在NoisyNet-A3C变体的表现性能提升最为显著，在四个游戏中的性能提升均大于250%。

将上面的57个游戏的性能表现汇总，可以得出三种智能体的NoisyNet变体的整体数据。

△ 整体数据图

可以看出，三种变体的性能平均值及中值都大大优于原始基线。

最后，附论文下载地址：

https://arxiv.org/abs/1706.10295

【完】

一则通知

量子位读者4群开放申请，对人工智能感兴趣的朋友，可以添加量子位小助手的微信qbitbot2，申请入群，一起研讨人工智能。

另外，量子位大咖云集的自动驾驶技术群， 仅接纳研究自动驾驶相关领域的在校学生或一线工程师 。申请方式：添加qbitbot2为好友，备注“ 自动驾驶 ”申请加入~

请到「今天看啥」查看全文

推荐文章

爱可可-爱生活 · 【LUCY：一款专注于语言理解和控制的AI项目，致力于打造早期阶-20250223130200

17 小时前

爱可可-爱生活 · 【[228星]Flock：基于工作流的低代码平台，快速构建聊天机-20250223130847

17 小时前

黄建同学 · AI Agent的评估包括↓一、核心能力• 任务完成度：关注准确-20250221231759

2 天前

量子位 · 刚刚，DeepSeek能看懂猫片了！腾讯混元加持

2 天前

AI前线 · 微软力推新视频游戏 AI 模型，超 10 亿张画面训练、相当于 7 年老玩家？开发者们：去他的吧！

2 天前

TechWeb · 时间过的太快三星居然开始卖起腰带

8 年前

墨香中华 · 过去100年，这100个人改变了人类思想方式

8 年前

Cocoa开发者社区 · 【译】如何建立一款App的配色方案

8 年前

互联网聚焦 · 中央一号文件刚刚公布，农民要暴富了！

8 年前

鲁中晨报 · 多户居民进不了家门，电动车也没法骑了，淄博这个小区发生了什么……

7 年前

DeepMind发布新论文：嘈杂网络让智能体成为游戏大咖

正文

安妮 编译自 ArXiv 量子位出品 | 公众号 QbitAI

论文摘要

游戏大咖

△ 三种智能体的NoisyNet变体和基线的表现性能比较

△ 整体数据图

一则通知

请到「今天看啥」查看全文

安妮编译自 ArXiv
量子位出品 | 公众号 QbitAI