专栏名称: 自动驾驶之心
自动驾驶开发者社区,关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向!
目录
相关文章推荐
天津高法  ·  全职妈妈离婚,能否请求“家务补偿”? ·  昨天  
大皖新闻  ·  凌晨,安徽铜陵警方带走13人! ·  昨天  
大皖新闻  ·  凌晨,安徽铜陵警方带走13人! ·  昨天  
最高人民法院  ·  表决通过! ·  2 天前  
最高人民法院  ·  寻找“明白人” ·  3 天前  
最高人民法院  ·  全国政协十四届三次会议闭幕 ·  3 天前  
51好读  ›  专栏  ›  自动驾驶之心

论文推土机​World Models一览~

自动驾驶之心  · 公众号  ·  · 2025-02-20 07:30

正文

作者 | 论文推土机 编辑 | 自动驾驶之心

原文链接:https://zhuanlan.zhihu.com/p/21030160168

点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号

戳我-> 领取 自动驾驶近15个 方向 学习 路线

>> 点击进入→ 自动驾驶之心 世界模型 技术交流群

本文只做学术分享,如有侵权,联系删文

Ha, D., & Schmidhuber, J. (n.d.). World Models. world model的工作模式和自动驾驶预测决策规划如出一辙,我认为world model是自动驾驶数据驱动方式的终局方案。perception对应V model, 预测对应M model,决策规划则是C model,在感知输入下,world model具有ego action对环境影响的判断能力,可以预测出next Z, 通过ego action的rollouts获得这种自车行为对未来的影响与演化过程,最后找到best policy,这不就是自动驾驶在做的事情吗。

world model

world model的组成有两部分:vision model + memory model. 其中vision model将高维度视觉信息转变成低维度信息,这里通过VAE完成:

memory model采用了MDN-RNN模型实现,说白了就是混合高斯模型+LSTM. memory模块要维护一个latent state h, 它用于存储历史信息。此外他还要有预测未来的能力:“we also want to compress what happens over time. For this purpose, the role of the M model is to predict the future.”未来的状态记为z:“we train our RNN to output a probability density function p(z) instead of a deterministic prediction of z”。那这里有一个说法,关于z怎么表达,不同文章有不同的做法,比如可以是deterministic的做法,直接就是确定的z, 或者是这里的gaussian distribution用于容纳不确定性,也有dreamer系列的做法,搞成discrete的形式。下图表达了world model的结构,不过这里还不完整,少了action.

所以更准确的表达是带上action:

训练:

vision, memory and control三部分都是互相独立的,各训练各自的即可:

vision部分就是要训练一个重建任务:

memory部分是要训练一个对未来的预测任务:

在后面的附录里面还有一个更明确的图:

RNN输出两个东西,一个是latent state h: "M will then take the current zt and action at as an input to update its own hidden state to produce ht+1 to be used at time t + 1.", 还有一个未来的预测z。看到这里的温度系数,用于加入噪声,温度系数越大,则对网络施加的干扰越大。文中说到可以“adjust τ to control the uncertainty of the environment generated by M”。

controller就是参数量极小的MLP: =







请到「今天看啥」查看全文


推荐文章
大皖新闻  ·  凌晨,安徽铜陵警方带走13人!
昨天
大皖新闻  ·  凌晨,安徽铜陵警方带走13人!
昨天
最高人民法院  ·  表决通过!
2 天前
最高人民法院  ·  寻找“明白人”
3 天前
最高人民法院  ·  全国政协十四届三次会议闭幕
3 天前
未读  ·  前方有妖怪!请注意!
7 年前
剑圣喵大师  ·  怎样的父母,能轻松搞定孩子
7 年前
贤二机器僧  ·  为什么这么多人都说自己不快乐
7 年前