专栏名称: 数学人生
欢迎关注数学人生。这里为大家提供江湖八卦,数学秘籍,科研经验,留学总结,转行咨询等各类信息。————读完博士之后,有人问我当年读博士期间一个人夜晚从办公室回宿舍的心情,我想起的不是孤单和路长,而是波澜壮阔的大海和天空闪耀的星光。
目录
相关文章推荐
超级数学建模  ·  这瓶面霜,让你明白抗老意义在哪!28天淡化法 ... ·  2 天前  
超级数学建模  ·  这是我第一次知道分手有多痛苦... ·  2 天前  
超级数学建模  ·  限时领 | ... ·  2 天前  
老顾谈几何  ·  浅谈黎曼因式分解理论 ·  昨天  
51好读  ›  专栏  ›  数学人生

深度学习与强化学习

数学人生  · 公众号  · 数学  · 2017-11-10 23:45

正文

随着 DeepMind 公司的崛起, 深度学习和 强化学习 已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外,DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI,并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。 虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家,但是 AI 却能够带给大家无穷的想象力和期待。


本篇 PPT 将会从强化学习的一些简单概念开始,逐步介绍值函数与动作值函数,以及 Q-Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起,来实现一些简单的游戏 AI。


之前也写过一份PPT《 当强化学习遇见泛函分析 》,之前 文章从强化学习的定义出发,一步一步地给读者介绍强化学习的简单概念和基本性质,并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念,并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。








请到「今天看啥」查看全文