专栏名称: 智能车情报局
聚焦智能汽车关键技术与创新产品
目录
相关文章推荐
小众软件  ·  半夜调API是大冤种?哦是 ... ·  12 小时前  
APPSO  ·  DeepSeek ... ·  22 小时前  
小众软件  ·  男人的乐趣,就是叛逆啊 ·  昨天  
APPSO  ·  阿里深夜发布重磅开源!暴击 Sora ... ·  2 天前  
小众软件  ·  微软开始测试免费的 Office 365 三件套 ·  2 天前  
51好读  ›  专栏  ›  智能车情报局

基于多模态 LLM 的自动驾驶智能体 | 公开课回顾【附PPT下载与完整回放】

智能车情报局  · 公众号  ·  · 2024-10-27 22:47

正文


10月22日,由智猩猩联合 NVIDIA 策划推出的「 智猩猩公开课 NVIDIA 自动驾驶智能体专场 」顺利完结。 NVIDIA Research 自动驾驶方向研究科学家李柏依 以《 探索基于多模态LLM 的自动驾驶智能体 》为主题进行了直播讲解,共涉及 LLaDA、TOKEN 以及 Wolf 三篇论文成果。


首先,李柏依博士通过视频 demo 介绍了自动驾驶智能体 LLaDA 如何为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导;之后通过对比GPT-Driver、人类驾驶员、LLaDA 的驾驶轨迹,分析了 LLaDA 如何帮助自动驾驶汽车和人类驾驶员调整轨迹策略,使其可以在世界的任何地方驾驶。


而在复杂交通场景中,车辆之间存在过多交互,这会导致智能体在预测时产生幻觉,从而影响其规划性能。为此,李柏依博士详解了如何基于 TOKEN 分解复杂交通场景,进而提升智能体在长尾事件的规划能力。


最后,李柏依博士介绍了能够提升智能体场景理解能力的自动化视频字幕生成模型 Wolf,并对比分析了 Wolf 与 GPT-4V、CogAgent、VILA-1.5-13b 等其他模型。


目前,此次公开课的课件 PPT 已上传至本公众号【 智能车情报局 】,大家可以在后台回复关键词“ 自动驾驶智能体 ”进行获取和学习。


完整回放


错过本次直播的朋友,可以观看「智猩猩公开课 NVIDIA 自动驾驶智能体专场」完整回放。



精选PPT



相关资料

论文成果1

标题

《LLaDA: Driving Everywhere with Large Language Model Policy Adaptation》


链接

https://arxiv.org/abs/2402.05932


项目地址







请到「今天看啥」查看全文