专栏名称: 炼数成金前沿推荐
关注炼数成金,学习数据挖掘与分析技巧,了解最新快的数据分析课程信息。更多知识更多优惠,尽在炼数成金!招募天下好汉,一起炼数成金!
目录
相关文章推荐
武汉本地宝  ·  下调!湖北当前油价是多少? ·  4 天前  
艾邦高分子  ·  高分子材料在3D打印鞋类中的应用 ·  3 天前  
高分子科学前沿  ·  香港大学Alan C. H. ... ·  3 天前  
高分子科技  ·  中国科大李木军团队 ACS ... ·  6 天前  
高分子科技  ·  苏州大学王召教授团队 Nat. ... ·  4 天前  
51好读  ›  专栏  ›  炼数成金前沿推荐

OpenAI强化学习实战

炼数成金前沿推荐  · 公众号  ·  · 2018-06-06 17:25

正文

在过去的几年里,强化学习(RL,Reinforcement Learning)在很多方面取得了突破。DeepMind公司将深度学习与增强学习结合在一起,在众多的Atari游戏中来取得超越人类的表现,基于深度学习和强化学习训练得到的AlphaGo Zero更是完全从零开始,仅通过自我对弈就能天下无敌。虽然RL目前在许多游戏环境中都表现很出色,但它对解决需要最优决策和效率的问题而言是种全新方法,而且肯定会在机器智能中发挥作用。


OpenAI成立于2015年底,是一个非营利组织。它的目的是“建立安全的人工通用智能(AGI),并确保AGI的福利被尽可能广泛和均匀地分布”。除了探索关于AGI的诸多问题之外,OpenAI对机器学习世界的一个主要贡献是开发了Gym和Universe软件平台。


Gym是为测试和开发RL算法而设计的环境/任务的集合。它让用户不必再创建复杂的环境。Gym用Python编写,它有很多的环境,比如机器人模拟或Atari 游戏。它还提供了一个在线排行榜,供人们比较结果和代码。


课程大纲:

第1周 强化学习与常用的仿真环境平台介绍(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)

第2周 OpenAI gym中的常用仿真环境介绍,包括Atari 2600 游戏系列、MuJoCo 物理模拟器、Toy text 文本环境、Robotics机械手与机械臂模拟器等

第3周 马尔科夫决策过程MDP

第4周 基于gym的MDP实例讲解,基于OpenAI Gym构建股票市场交易环境

第5周 基于gym的强化学习实践:基于值函数的强化学习方法实现;基于策略梯度的强化学习方法实现

第6周 虚拟环境Universe: 一个用于训练解决通用问题 AI 的基础架构

第7周 基于Universe的强化学习实践:用OpenAI公司的Gym工具库和Universe平台为游戏创建人工智能机器人


开课时间:

本期课程将于6月9日开课,预计课程持续时间为9周


目标人群:

有简单的强化学习基础,希望学习强化学习的落地实现的同学


课程环境:

python3+OpenAI GYM+OpenAI Universe


收获预期:

学习结束后均能自己动手编写一个仿真环境,训练强化学习







请到「今天看啥」查看全文