专栏名称: PaperWeekly

PaperWeekly是一个分享知识和交流学问的学术组织，关注的领域是自然语言处理的各个方向。我们热爱知识，分享知识，希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #10

PaperWeekly · 公众号 · 科研 · 2017-05-03 12:32

正文

请到「今天看啥」查看全文

David Silver 博士是 AlphaGo 的最主要研发人员。众所周知，AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。AlphaGo 底层核心技术包括深度学习（deep learning）、强化学习（reinforcement learning），和蒙特卡洛搜索树（Monte Carlo tree search）。

在这门强化学习的课程中，Silver 博士从简介、马尔科夫决策过程（Markov Decision Processes）、免模型预测（Model-free Prediction）、免模型控制（Model-free Control）、值函数近似（Value Function Approximation）、策略梯度算法（Policy Gradient）、集成学习和计划（Integrating Learning and Planning）、探索与利用（Exploration and Exploitation）、游戏等方面深入浅出地介绍强化学习。课程中也涉及最近的热点：深度强化学习。

本周我们继续为大家带来该系列课程的第十课。课程资源获取方式如下：

> > > >

获取第十课视频

关注“Paperweekly”微信公众号，回复“ 第十课 ”获取视频链接。

学习形式

我们将在每周推出两节由 AI100 翻译制作的课程，大家可扫描下方二维码添加管理员微信，申请加入学习小组进行讨论学习。此外，我们还将在每周末设置“Ask Me Anything”答疑环节。

课程回顾

课程介绍及往期课程观看地址：

David Silver深度强化学习课程「中文字幕」— #共同学习

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #02

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #03

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #04

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #05

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #06

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #07

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #08

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #09

关于PaperWeekly

PaperWeekly是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事AI领域，欢迎在公众号后台点击 「交流群」 ，小助手将把你带入PaperWeekly的交流群里。