专栏名称: StuQ
实践驱动的IT教育平台
目录
相关文章推荐
杭州本地宝  ·  3月30日起!200+咖啡连续4天免费喝!杭 ... ·  4 小时前  
杭州本地宝  ·  4763套!杭州2025年第2期公租房实物配 ... ·  昨天  
余杭发布  ·  王浩在余杭区调研:坚持干字当头 ... ·  2 天前  
51好读  ›  专栏  ›  StuQ

如何1小时快速入门强化学习?

StuQ  · 公众号  ·  · 2017-09-13 20:15

正文

编辑|Gina
什么是深度强化学习

深度强化学习(Deep Reinforcement Learning)是将深度学习与强化学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算法。举例来理解,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有hand-crafted工作。

整个过程,就是一个连续决策的过程,其特点是不给任何数据做标注,仅仅提供一个回报函数,这个回报函数决定当前状态得到什么样的结果(比如“好”还是“坏”),强化学习最终目的是让决策过程中整体的回报函数期望最优,深度增强学习具备使机器人实现完全自主的学习一种甚至多种技能的潜力。

学习深度强化学习需要哪些基础

虽然说,深度强化学习可以从零开始,但是毕竟这还是深度学习中的最前沿的算法,为了更好的理解,大家还是要具备一些基本基础:

  • 数学基础:线性代数基础和概率论基础;

  • 编程基础:Python编程基础,后面的代码实现可以基于Tensorflow实现。

What next?

由于深度强化学习的样本是一个时间序列,要将增强学习的问题模型化,就必须掌握MDP(Markov Decision Process)马尔科夫决策过程。







请到「今天看啥」查看全文