专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
机器之心  ·  AI「视觉图灵」时代来了!字节OmniHum ... ·  昨天  
宝玉xp  ·  转发微博-20250205150219 ·  昨天  
宝玉xp  ·  Lex Fridman ... ·  昨天  
爱可可-爱生活  ·  【The End of Search, ... ·  昨天  
宝玉xp  ·  Anthropic 并不鼓励用 AI ... ·  2 天前  
51好读  ›  专栏  ›  机器学习研究会

【干货】易忽略的强化学习知识之基础知识及MDP【上】

机器学习研究会  · 公众号  · AI  · 2017-12-20 22:33

正文

推荐阅读时间:8min~12min

主要内容:容易忽略的强化学习知识之基础知识及MDP

由于我对RL的期望挺大,很看好它的前景,故之后应该会写下一个系列的强化学习文章,标题是易忽略的强化学习知识之XX,也就是说,我写下的是我觉得有必要知道比较重要并容易忽略的知识。也许不会所有强化学习的知识都全面的写,但希望可以对大家有所帮助,同时巩固我自己的知识!

  1. 强化学习是什么?和监督学习,无监督学习是什么关系?

  2. 强化学习的主要应用是什么?在其他如NLP的应用呢?

  3. 模仿学习是什么?和强化学习联系?

  4. 强化学习的整体运行流程是什么样的呢?

  5. 强化学习的分类

  6. 什么是马尔可夫(Markov)性?什么是MP?什么是MRP?

  7. 动态规划是什么?为什么可以利用动态规划来解决MDP?


1
强化学习是什么?和监督学习,无监督学习是什么关系?



强化学习是什么 :是多学科多领域交叉的一个产物,它的本质就是解决“decision making”问题,即学会自动进行决策。


在计算机科学领域体现为机器学习算法。
在工程领域体现在决定操作动作的顺序来得到最好的结果。
在神经科学领域体现在理解人类大脑如何做出决策,主要的研究是奖励机制。
在心理学领域,研究动物如何做出决策,动物的行为是由什么导致的。
在经济学领域体现在博弈论的研究。

.......

它是什么可以是如图所示:



以上所有的问题最终都归结为一个问题,人 为什么能够并且如何做出最优决策 。是 怎么样找到最优决策的


2






请到「今天看啥」查看全文