专栏名称: PaperWeekly
PaperWeekly是一个分享知识和交流学问的学术组织,关注的领域是自然语言处理的各个方向。我们热爱知识,分享知识,希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。
目录
相关文章推荐
51好读  ›  专栏  ›  PaperWeekly

NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR

PaperWeekly  · 公众号  · 科研  · 2017-11-07 12:05

正文

请到「今天看啥」查看全文



上周我们发布了 《攻略 | 虽然票早已被抢光,你可以从机器之心关注 NIPS 2017》 ,在 NIPS 2017 正式开始前,我们将选出数篇优质论文,邀请论文作者来做线上分享,聊聊理论、技术和研究方法。


所以,第一期分享来了。


北京时间 11 月 8 日 20:00 至 21:00,多伦多大学在读三年级博士生 Yuhuai Wu(吴宇怀)将为大家分享一篇 NIPS 2017 论文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。



分享者简介


Yuhuai Wu(吴宇怀),多伦多大学在读三年级博士生,师从 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指导下做研究。主要研究方向是优化算法、强化学习。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做实习,开源了 ACKTR 算法。



演讲主题


这次演讲主要研讨一个最近研发的似自然梯度的优化算法 -- KFAC(似二阶算法)。我们将其用在强化学习的问题上,并提出了新的强化学习算法 -- ACKTR,发现比前人的算法有效 2-3 倍。


针对这篇论文,机器之心曾发布过一篇简介: 《OpenAI 开源算法 ACKTR 与 A2C:把可扩展的自然梯度应用到强化学习》 ,请大家做课前预习。


参与方式


线上分享将在「NIPS 2017 机器之心官方学霸群」中进行。 加群方式: 长按扫描下方二维码,添加「机器之心小助手Ⅱ」, 备注暗号:147 ,由小助手拉大家入群。



「阅读原文」 ,查看机器之心 NIPS 2017 专题策划并参与其中。








请到「今天看啥」查看全文