专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  【Savanna:为卷积多混合模型(Stri ... ·  昨天  
黄建同学  ·  AI自己写AI来了↓ 来自Sakana ... ·  昨天  
机器之心  ·  出人意料!DeepSeek-R1用的GRPO ... ·  昨天  
51好读  ›  专栏  ›  AI科技评论

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

AI科技评论  · 公众号  · AI  · 2018-12-20 23:31

正文

AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,今天正式上线中英双语字幕版课程啦!

我们先来一睹为快——

第一讲

课程介绍和概览

上手视频约 5 分钟

翻译 | 朱海浩   段小杰   周清逸 字幕 | 凡江


看完是不是不够过瘾!

请扫描下方二维码, 加入官方学习小组

即可观看 完整视频

↓↓↓

回复字幕君(微信: leiphonefansub)

加入该课程小组的截图

我们将你拉 入微信群聊

加我时备注“CS294加群”~


课程介绍

伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。

12 月 20 日开始正式同步更新在 AI 研习社,大约 1 到 2 周更新一次。

该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。


先修要求

想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。

如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:

  • 增强学习和马尔科夫决策过程(MDPs)

MDPs的定义

具体算法:策略迭代和价值迭代

搜索算法

  • 数值最优化方法

梯度下降和随机梯度下降

反向传播算法

  • 机器学习

分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型

训练/测试误差,过拟合


视频截图


译者评价

比较有趣,讲课用很多例子来解释,不是那种光给你一大堆公式概念的,感觉偏重实际应用和前沿技术一点,推荐大家来看。

@周清逸

这门课是基本覆盖了强化学习的主要内容和前沿的研究话题,通过理论到应用例子的讲述,以及五次作业(实际上是七次)的实践练习对经典算法的复现,可以让学生达到在强化学习领域的入门研究水平。重点是免费!课程有中文字幕!有作业参考!不过这门课并不是零门槛,需要上过机器学习课程,最好是还上过深度学习(比如cmu deeplearning),最最好用过tensorflow(因为作业的官方基础代码只有tensorflow版本)。

@朱海浩

侧重于增强学习与深度学习相结合,应用在机器人方面的例子比较多,翻译的话老师语速挺快的,虽然语气词比较多,整体逻辑很清晰。

@段小杰


课程大纲

第一讲:课程介绍和概览

第二讲:监督学习和模仿学习







请到「今天看啥」查看全文