专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

【干货】易忽略的强化学习知识之基础知识及MDP【上】

机器学习研究会 · 公众号 · AI · 2017-12-20 22:33

正文

推荐阅读时间：8min~12min

主要内容：容易忽略的强化学习知识之基础知识及MDP

由于我对RL的期望挺大，很看好它的前景，故之后应该会写下一个系列的强化学习文章，标题是易忽略的强化学习知识之XX，也就是说，我写下的是我觉得有必要知道比较重要并容易忽略的知识。也许不会所有强化学习的知识都全面的写，但希望可以对大家有所帮助，同时巩固我自己的知识！

强化学习是什么？和监督学习，无监督学习是什么关系？

强化学习是什么 ：是多学科多领域交叉的一个产物，它的本质就是解决“decision making”问题，即学会自动进行决策。

在计算机科学领域体现为机器学习算法。
在工程领域体现在决定操作动作的顺序来得到最好的结果。
在神经科学领域体现在理解人类大脑如何做出决策，主要的研究是奖励机制。
在心理学领域，研究动物如何做出决策，动物的行为是由什么导致的。
在经济学领域体现在博弈论的研究。
.......

它是什么可以是如图所示：

以上所有的问题最终都归结为一个问题，人 为什么能够并且如何做出最优决策 。是 怎么样找到最优决策的

推荐文章

机器之心 · AI「视觉图灵」时代来了！字节OmniHuman，一张图配上音频，就能直接生成视频

昨天

宝玉xp · 转发微博-20250205150219

昨天

宝玉xp · Lex Fridman 播客节选：DeepSeek 到底用了多少-20250205132137

昨天

爱可可-爱生活 · 【The End of Search, The Beginnin-20250205110002

昨天

宝玉xp · Anthropic 并不鼓励用 AI 写他们家的求职申请：我们-20250204222647

2 天前

养花大全 · 美图 | 把多肉养成手捧花，才是我的终极梦想！

8 年前

时拾史事 · 任人唯“亲戚”从不是贪官的特权

8 年前

治愈系心理学 · 唯有你也想见我的时候，我们见面才有意义。

7 年前

广东台今日关注 · 急降9℃！冷空气今夜携雨来袭

7 年前

教你看穿男人的心 · “冷落”是试探男人是否真心的最好方法~

7 年前