专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
黄建同学  ·  v0刚刚更新了根据截图生成 UI ... ·  4 天前  
爱可可-爱生活  ·  【AI前沿:高效训练与智能分析】本期节目带你 ... ·  5 天前  
爱可可-爱生活  ·  【bRAG-langchain:构建自己的R ... ·  6 天前  
机器之心  ·  Karpathy后悔了:2015年就看到了语 ... ·  1 周前  
51好读  ›  专栏  ›  机器学习研究会

【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版

机器学习研究会  · 公众号  · AI  · 2017-10-31 22:21

正文



点击上方“机器学习研究会”可以订阅
摘要
 

转自:专知

【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。Alpha Zero的背后核心技术是深度强化学习,为此,专知有幸邀请到叶强博士根据DeepMind AlphaGo的研究人员David Silver《深度强化学习》视频公开课进行创作的中文学习笔记,在专知发布推荐给大家!(关注专知公众号,获取强化学习pdf资料,详情文章末尾查看!)


 叶博士创作的David Silver的《强化学习》学习笔记包括以下:

 笔记序言:【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

  1. 《强化学习》第一讲 简介

  2. 《强化学习》第二讲 马尔科夫决策过程

  3. 《强化学习》第三讲 动态规划寻找最优策略

  4. 《强化学习》第四讲 不基于模型的预测

  5. 《强化学习》第五讲 不基于模型的控制

  6. 《强化学习》第六讲 价值函数的近似表示

  7. 《强化学习》第七讲 策略梯度

  8. 《强化学习》第八讲 整合学习与规划

  9. 《强化学习》第九讲 探索与利用


以及包括也叶博士独家创作的强化学习实践系列!


作者简介:


叶强,眼科专家,上海交通大学医学博士, 工学学士,现从事医学+AI相关的研究工作。


原文链接:

https://mp.weixin.qq.com/s/y1aa_nIimSv4wlprGFHR7g

“完整内容”请点击【阅读原文】
↓↓↓