专栏名称: 智能车情报局
聚焦智能汽车关键技术与创新产品
目录
相关文章推荐
创业家  ·  牛文文:DeepSeek席卷全球,给所有创业 ... ·  2 天前  
创业家  ·  打工人吃什么,这几个安徽人说了算 ·  2 天前  
Founder Park  ·  DeepSeek开源周第二天:DeepEP通 ... ·  2 天前  
Founder Park  ·  DeepSeek开源周第二天:DeepEP通 ... ·  2 天前  
半导体行业联盟  ·  中国AI江湖:「清华系VS浙大系」!恩怨情仇 ... ·  3 天前  
51好读  ›  专栏  ›  智能车情报局

南洋理工大学提出WiseAD:基于视觉语言模型的知识增强端到端自动驾驶

智能车情报局  · 公众号  ·  · 2025-01-17 20:11

正文

讲座预告

1月23日晚7点 ,#智猩猩新青年讲座自动驾驶专题 第43讲开讲啦!上海人工智能实验室科研实习生卞恒玮和孔令东将以 《大规模4D自动驾驶场景生成》 为主题进行直播讲解,详解4D动态场景生成框架DynamicCity。欢迎扫码报名~


文章转载自公众号:自动驾驶专栏。本文只做学术/技术分享,如有侵权,联系删文。

  • 论文链接:https://arxiv.org/pdf/2412.09951

01

摘要


本文介绍了WiseAD: 基于视觉语言模型的知识增强端到端自动驾驶。 在快速发展的视觉语言模型(VLMs)中通用人类知识和强大逻辑推理能力的出现促使人们越来越有兴趣将VLMs应用于高级自动驾驶任务,例如场景理解和决策。 然而,对知识熟练度(特别是基本的驾驶专业知识)与闭环自动驾驶性能之间关系的深入研究需要进一步探索。 本文研究了基础驾驶知识的深度和广度对闭环轨迹规划的影响,并且引入了WiseAD,这是一种专门为端到端自动驾驶而设计的特定VLM,它能够在各种场景下实现驾驶推理、行为判定、目标识别、风险分析、驾驶建议和轨迹规划。 本文采用驾驶知识和规划数据集进行联合训练,使模型能够相应地执行知识对齐的轨迹规划。 大量实验表明,随着驾驶知识多样化的扩展,严重事故显著减少,在Carla闭环评估中的驾驶得分和路线完成率分别提升了11.9%和12.4%,从而实现了最先进的性能。 此外,WiseAD在域内和域外数据集上的知识评估中也展现出卓越的性能。

02

主要贡献


本文的贡献总结如下:


1)本文提出了WiseAD,这是一种专门为自动驾驶而设计的知识增强视觉语言模型。该模型结合了从不同场景中采集的大量基础驾驶知识,增强了驾驶推理、行为判定、目标识别、场景描述、风险分析、驾驶建议和轨迹规划等领域的通用知识认知;

2)本文进行了大量的实验,结果证明,通过合理训练范式扩展知识的深度和广度可以持续提高知识评估结果和端到端驾驶性能;

3)本文的综合实验证明了WiseAD在闭环驾驶和与驾驶相关的知识评估方面的有效性,它实现了最先进的性能。


03

论文图片和表格











04

总结







请到「今天看啥」查看全文