点击下方
卡片
,关注
「3D视觉工坊」
公众号
选择
星标
,干货第一时间送达
本次分享我们邀请到了清华大学智能产业研究院在读博士
郑一楠
,为大家详细介绍他的工作:
Diffusion Planner
。如果您有相关工作需要分享,欢迎文末联系我们。
Diffusion-Based Planning for Autonomous Driving with Flexible Guidance
主页
:
https://zhengyinan-air.github.io/Diffusion-Planner/
论文
:
https://arxiv.org/pdf/2501.15564
代码
:
https://github.com/ZhengYinan-AIR/Diffusion-Planner
直播信息
时间
2025年
2月18日
(周二)
19:00
主题
ICLR'25 Oral | 清华提出Diffusion Planner 实现 nuPlan SOTA!
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播
3D视觉工坊视频号
也将同步直播
主讲嘉宾
郑一楠
清华大学智能产业研究院在读博士。研究方向为自动驾驶,具身智能。在ICLR, ICML, NeurIPS发表多篇顶会论文,并担任审稿人。
个人主页
:
https://zhengyinan-air.github.io/
直播大纲
扩散模型作为一种强大的生成模型得到广泛应用,但在自动驾驶规划中的探索仍有限。Diffusion Planner充分发挥其在闭环规划中的潜力,联合建模周车预测与自车规划中的多模态行为,并通过灵活的引导机制,使模型在部署阶段适应不同的驾驶需求。
-
-
-
基于扩散模型的自动驾驶规划算法Diffusion Planner
参与方式
相关工作
本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于
ICLR 2025
的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。该算法创新性地设计了
基于 Diffusion Transformer 的自动驾驶规划模型架构
,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。此外,借助
扩散模型的引导机制
,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。
论文链接
:
https://arxiv.org/pdf/2501.15564
项目主页
:
https://zhengyinan-air.github.io/Diffusion-Planner/
背景介绍
自动驾驶规划
正朝着更安全、高效的方向发展,但在复杂环境下实现类人驾驶仍具挑战。基于规则的方法虽在工业应用中取得成功,但适应性差,调整成本高;模仿学习能直接学习专家驾驶行为,并随训练数据扩展提升性能。然而,模仿学习方法在多模态行为适应性、泛化能力和驾驶风格灵活调控上仍存挑战,依赖后处理来优化模型输出。
近年来,
扩散模型
在决策领域得到广泛应用,但在自动驾驶规划中的探索仍有限。现有研究多聚焦于运动预测和场景生成,关注开环性能,而非闭环规划。一些方法尝试将扩散模型应用于规划任务,但仅仅是沿用现有结构或扩展模型参数,缺乏针对性结构设计,导致仍然高度依赖后处理。
为此,我们提出了
Diffusion Planner
,一种创新的
基于扩散模型的自动驾驶规划方法
。通过扩散模型强大的数据分布拟合能力,Diffusion Planner能够精准捕捉复杂场景中周车与自车的多模态驾驶行为,并实现周车预测与自车规划的联合建模。同时,基于Transformer的结构设计高效处理复杂场景输入,实现20Hz的高速实时推理。此外,借助灵活的引导机制,模型在部署阶段即可适应不同的驾驶需求。在大规模真实数据集 nuPlan 的闭环评估中,
Diffusion Planner取得了SOTA级表现,⼤幅降低了对后处理的依赖
,并在额外收集的 200 小时物流小车数据上验证了其在多种驾驶风格下的鲁棒性和迁移能力。