专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
半月谈  ·  品读 | 北宋三人与杭黄两州 ·  14 小时前  
侠客岛  ·  对话郑永年:DeepSeek带来的震撼与启示 ·  3 天前  
IPRdaily  ·  2024年IPR ... ·  4 天前  
51好读  ›  专栏  ›  3D视觉工坊

CVPR&NeurIPS2024开源 | 迈向通用可泛化的自动驾驶世界模型

3D视觉工坊  · 公众号  ·  · 2024-10-24 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

本次分享我们邀请到了香港科技大学在读博士 高深远 为大家着重介绍他的 GenAD和Vista系列工作 。如果您有相关工作需要分享,欢迎文末联系我们。

Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability
论文 https://arxiv.org/pdf/2405.17398
代码 https://github.com/OpenDriveLab/Vista

GenAD: Generalized Predictive Model for Autonomous Driving
论文 https://arxiv.org/pdf/2403.09630
代码 https://github.com/OpenDriveLab/DriveAGI

近期,世界模型在具身智能的多个子领域都得到了广泛的关注。世界模型是真实世界的模拟,可以预测不同控制指令对应的未来状态,并反馈给智能体的训练和决策过程。作为通往L5自动驾驶的关键技术之一,世界模型也在自动驾驶领域也受到了广泛的关注。 本次分享将着重介绍GenAD和Vista系列工作,为构建开放场景中通用可泛化的自动驾驶世界模型提供了一条可行的技术路线。相关工作已先后被CVPR 2024和NeurIPS 2024接收

直播信息

时间

2024年 10月24日 (周四) 19:00

主题

CVPR2024&NeurIPS2024开源
迈向通用可泛化的自动驾驶世界模型

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3DCV视频号 也将同步直播

嘉宾介绍

高深远

香港科技大学在读博士,研究兴趣主要围绕具身场景中世界模型的构建及应用。曾在CVPR、NeurIPS、ECCV以第一作者身份发表多篇论文,并担任TPAMI、ICLR、NeurIPS、CVPR等期刊会议的审稿人。

个人主页 https://github.com/Little-Podi







请到「今天看啥」查看全文