专栏名称: PaperWeekly
PaperWeekly是一个分享知识和交流学问的学术组织,关注的领域是自然语言处理的各个方向。我们热爱知识,分享知识,希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。
目录
相关文章推荐
社会学理论大缸  ·  如何找到领域“最相关”的文献?附案例示范 ·  昨天  
PaperWeekly  ·  WizardLM新作!AgentGen:通过 ... ·  3 天前  
研之成理  ·  Phil S. Baran,又一篇Science! ·  1 周前  
51好读  ›  专栏  ›  PaperWeekly

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #09

PaperWeekly  · 公众号  · 科研  · 2017-04-28 18:23

正文

David Silver 博士是 AlphaGo 的最主要研发人员。众所周知,AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。AlphaGo 底层核心技术包括深度学习(deep learning)、强化学习(reinforcement learning),和蒙特卡洛搜索树(Monte Carlo tree search)。 


在这门强化学习的课程中,Silver 博士从简介、马尔科夫决策过程(Markov Decision Processes)、免模型预测(Model-free Prediction)、免模型控制(Model-free Control)、值函数近似(Value Function Approximation)、策略梯度算法(Policy Gradient)、集成学习和计划(Integrating Learning and Planning)、探索与利用(Exploration and Exploitation)、游戏等方面深入浅出地介绍强化学习。课程中也涉及最近的热点:深度强化学习。


本周我们继续为大家带来该系列课程的第九课。课程资源获取方式如下:


>>>>

获取第九课视频


关注“Paperweekly”微信公众号,回复“第九课”获取视频链接。



学习形式



我们将在每周推出两节由 AI100 翻译制作的课程,大家可扫描下方二维码添加管理员微信,申请加入学习小组进行讨论学习。此外,我们还将在每周末设置“Ask Me Anything”答疑环节。





课程回顾



课程介绍及往期课程观看地址:


David Silver深度强化学习课程「中文字幕」— #共同学习

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #02

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #03

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #04

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #05

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #06

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #07

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #08





关于PaperWeekly


PaperWeekly 是一个分享知识和交流学问的学术组织,关注的领域是 NLP 的各个方向。如果你也经常读 paper,喜欢分享知识,喜欢和大家一起讨论和学习的话,请速速来加入我们吧。

关注微博: @PaperWeekly
    微信交流群: 后台回复“加群”