专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
数据派THU  ·  【CVPR2025】CarPlanner: ... ·  21 小时前  
CDA数据分析师  ·  【案例】小米、中国电信的用户画像分析案例 ·  昨天  
CDA数据分析师  ·  CDA数据人才能力模型与认证体系简介​ ·  3 天前  
大数据文摘  ·  从黑神话到哪吒2盲盒,一文读懂“首发经济” ·  2 天前  
51好读  ›  专栏  ›  数据派THU

【CVPR2025】CarPlanner: 一种用于自动驾驶大规模强化学习的一致性自回归轨迹规划

数据派THU  · 公众号  · 大数据  · 2025-03-14 19:27

正文

来源:专知

本文约1000字,建议阅读5分钟

在本文中,我们提出了CarPlanner,一种基于一致性的自回归规划器,利用RL生成多模态轨迹。


图片

轨迹规划对于自动驾驶至关重要,确保在复杂环境中实现安全高效的导航。尽管最近基于学习的方法,特别是强化学习(RL),在特定场景中展现了潜力,但RL规划器在训练效率和处理大规模现实驾驶场景方面仍面临挑战。
在本文中,我们提出了CarPlanner,一种基于一致性的自回归规划器,利用RL生成多模态轨迹。自回归结构实现了高效的大规模RL训练,而一致性的引入通过保持时间步之间的一致性,确保了稳定的策略学习。此外,CarPlanner采用了一种生成-选择框架,结合专家引导的奖励函数和不变视角模块,简化了RL训练并提升了策略性能。
大量分析表明,我们提出的RL框架有效解决了训练效率和性能提升的挑战,使CarPlanner成为自动驾驶轨迹规划的有前景的解决方案。据我们所知,我们是首个证明基于RL的规划器能够在具有挑战性的大规模现实数据集nuPlan上超越基于模仿学习(IL)和基于规则的最先进方法(SOTAs)的研究。我们提出的CarPlanner在这一高要求数据集中超越了基于RL、IL和规则的SOTA方法。






请到「今天看啥」查看全文