专栏名称: IT桔子

关注IT桔子，即时了解国内外IT互联网新公司新产品、投融资事件等信息。

端到端智驾半壁江山都来了！2025首场自动驾驶峰会全部嘉宾揭晓，还将拆解世界模型与VLM

IT桔子 · 公众号 · 科技投资 · 2025-01-03 12:33

正文

2025年1月14日，第四届全球自动驾驶峰会将在北京中关村国家自主创新示范区展示交易中心-会议中心举行。经过三年的发展，全球自动驾驶峰会已经成长为国内自动驾驶领域最具影响力、规模最大的产业峰会之一。

本次峰会由智一科技旗下智猩猩、车东西共同发起，以“技术新周期产业新征程”为主题，计划邀请30+位嘉宾同台分享和讨论，全方位呈现自动驾驶端到端新周期里的科研成果、技术探索、产品方案创新与未来趋势。

峰会由主会场+分会场+展区组成，主会场将进行开幕式、端到端自动驾驶创新论坛和城市NOA专题论坛，分会场将进行自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会。其中，分会场的两场技术研讨会为闭门会议，主要向持有峰会通票或贵宾票的用户开放。

已经迫不及待报名的朋友，可以先扫描下方二维码添加小助手报名啦！

来自近30家企业、高校与科研机构的嘉宾学者已确认参与主题演讲和圆桌Panel。接下来为大家一一介绍。更多信息可以关注峰会官网进行了解。

01、开幕式嘉宾阵容

清华大学车辆与运载学院党委书记、人工智能学院教授、博导李升波

理想汽车自动驾驶研发副总裁郎咸朋

智加科技首席科学家崔迪潇

演讲主题：《走向更安全更智能的干线物流》

内容概要：

干线物流面临着交通事故频发、人力短缺、运营成本高等痛点，利用自动驾驶技术赋能干线物流的降本增效是当前产业重点。作为全球领先的干线物流自动驾驶企业，智加拥有自研的L4级全无人自动驾驶全栈技术，并采用渐进式的自动驾驶商业化路线。

智加已率先实现了有人监督的“智加领航”系统的前装量产，并与物流领先企业荣庆、中通、安能等进行商业化合作，运营范围覆盖了中国主要经济贸易地区，在大规模真实物流线路运营中验证了“安全、省力、省油”的产品价值。

本次报告，将展示智加在L4级全无人自动驾驶技术研发和L2+高级别辅助驾驶量产产品的最新进展，分享在端到端自动驾驶上的前沿成果，并探讨如何加速走向L4级无人化场景。

元戎启行副总裁、技术合伙人刘轩

极佳科技合伙人&副总裁毛继明

辰韬资本执行总经理刘煜冬

演讲主题：《端到端新范式下的智能驾驶产业投资思考》

内容概要：

辰韬资本在2024年6月发布了《端到端自动驾驶行业研究报告》，首次提出了端到端技术架构演进的四个阶段，并对行业发展的诸多问题进行了较为全面的分析和展望。本次演讲将对近半年来端到端技术发展的新进展做一个回顾；同时，从投资视角分析，端到端新范式加速落地带来的智能驾驶产业发展新机遇。

02、端到端自动驾驶创新论坛

嘉宾阵容

中科院自动化所副研究员张启超

演讲主题：《监督学习式端到端自动驾驶的进展与挑战》

内容概要：

2024年，端到端自动驾驶是智驾行业的主战场，这一年国内智驾技术迅猛发展，部分公司已经完成了从智驾1.0向量产级端到端自动驾驶的快速切换，这其中数据基建工程带来的规模化效应(scaling law)为这一阶段性进展提供了强力支撑。

本次将从科研角度分享，监督学习范式下端到端自动驾驶的新进展及其面临的关键挑战，分享端到端自动驾驶scaling law的探索，并讨论针对目前面临的关键挑战一些值得进一步探索的研究方向。

零一汽车智能驾驶合伙人王泮渠

演讲主题：《端到端+大模型: 加速新能源重卡智能化之路》

内容概要：

随着新能源乘用车的跨越式发展，商用车，尤其是重卡的电动化与智能化成为了研究热点。零一汽车通过正向设计的新能源重卡平台，打造可量产的高阶智能驾驶重卡，成果显著。在智驾软件侧，针对传统自动驾驶算法架构复杂，成本高昂，泛化性差，量产困难的问题，我们提出了基于端到端与多模态大模型的解决方案，做到了框架简易，成本优势，泛化性强，量产友好。ZSD方案在多个公开数据集中获得最优成果，并在CVPR2024端到端自动驾驶挑战赛中以单摄像头方案荣获亚军。此外，我们基于ZSD打造了真实，高效，全面，自动的闭环仿真平台，真正为端到端方案的上车落地构建了良好的验证体系。在整车侧，我们正向设计了“水滴”冗余线控底盘系统，做到了高可靠，全功能，高性能，全冗余，数字化。这套系统大大优化了线控响应速度，提高了无故障连续运营时间，并大幅降低了系统成本。我们认为，基于强泛化算法，可量产平台，快闭环场景三要素的开发模式是真正实现新能源重卡智能化的必由之路。

昇启科技联合创始人兼CTO 刘敏俊

朗歌科技副总经理、智驾地图事业部总经理李战斌

演讲主题：《智驾地图，端到端时代的先验知识与关键模态》

内容概要：

数据闭环重塑高阶智驾未来，朗歌科技新一代城高一体智驾地图，通过周天数据智能体系聚合海量众源智驾数据，全方位提升智驾体验。智驾地图的生成，从传统的基于规则的构建，走向多模态大模型生成。朗歌智驾地图产线在云端，构建建图系统1和系统2及仿真校验系统。系统1实现端到端生成智驾图层，系统2实现复杂场景领航引导信息生成，仿真校验系统实现数据场景化复盘及增量数据回传。作为先验知识输入，智驾地图能够增强模型的道路感知能力，提升端到端上限；在特殊道路规则及无保护动态博弈等复杂场景下则能提供安全支撑，保障路径规划下限。同时，领航信息生成，助力智驾更像老司机。朗歌智驾地图已搭载领克08 EM-P及领克07 EM-P量产，收获良好用户口碑。朗歌科技将继续深度服务汽车智能化，加速推动智驾进程，与更多合作伙伴一起，开启智能驾驶新时代。

03、城市NOA专题论坛

嘉宾阵容

北汽研究总院智能网联中心专业总师林大洋

全道科技CTO 刘斌

演讲主题：《从1到10：新生态数据闭环重塑高阶智驾》

内容概要：

以端到端为代表的城市NOA方案，是2024年“全国都能开”的终点，但却是今后“全国都好用”的起点，冰山下的数据闭环体系和冰山上的先验信息对“好用、爱用”来说同样重要，是端到端方案拓展上限和提升下限的重要路径。

上海昱感微电子科技有限公司创始人＆CEO 蒋宏

演讲主题：《“多维像素”多模态雷视融合技术构建自动驾驶超级感知能力》

内容概要：

昱感微采用最前沿的多维像素多模态融合技术，将可见光摄像头、红外摄像头、4D毫米波雷达/激光雷达的探测数据在前端（数据获取时）融合，并将各传感器的探测数据“坐标统一、时序对齐”，最后以“多维像素”的数据格式输出；昱感微的核心技术创新——“多维像素”，它是指在可见光摄像头像素信息上加上其它传感器对于同源目标感知的信息：即图像数据+雷达探测目标的距离、速度、散射截面R的感知数据+红外传感器探测的热辐射图像数据叠加组合到一起，以摄像头的像素为颗粒度组合全部感知数据，每个像素不仅有视觉信息，还包含了雷达和红外传感器的探测数据，形成“多维像素”多模态融合感知数据组合。公司的“多维像素”多模态感知技术，可以为AI系统提供更加直接、高效、可扩展的环境与事件感知能力，能够有效助力目前的AI人工智能从目前的“计算智能”阶段（高效快速处理海量数据）升级到“感知智能”（多维度高效获取物理事件信息）然后再向“认知智能”（机器能够主动思考并采取行动）质变的演进。

昱感微第一代多维像素多模态感知产品（超级摄像头）将可见光摄像头、雷达以及红外摄像头数据融合，在高分辨率宽动态的可见光摄像头感知基础上，雷达提供目标的距离、速度维度的精准感知可以帮助可见光摄像头克服天气光线的影响，摄像头的图像又为雷达增添了语义信息，进一步提高雷达点云的置信度以及感知信息量；远红外摄像头有针对性的目标热辐射图像感知则赋予了自动驾驶系统卓越的夜视能力。昱感微“多维像素”超级摄像头就像是一双比人眼更敏锐的眼睛，看到的不仅仅是一幅幅二维的图像，还有更多维度的精确信息（目标的距离/速度/3D空间位置/温度/材质等)，形成完整的多模态“视觉语言”，令自动驾驶系统可以精确全面地感知道路上各种状况。基于技术创新的融合感知技术，我们为国内外客户的AI系统（智能驾驶、机器人等产品）赋能更加直接、高效、可扩展的环境与目标事件感知能力。

黑芝麻智能产品管理总监周勇

04、自动驾驶视觉语言模型技术研讨会

嘉宾阵容

上海人工智能实验室司马崇昊

华中科技大学Hust Vision Lab与地平线联合培养博士生蒋博

演讲主题：《地平线在端到端/VLM/VLA的探索与思考》

内容概要：

端到端目前十分火热，地平线是最早一批探索和应用端到端算法的企业。在本次分享中，我将介绍我们在端到端方面的最新技术探索，包括首次提出多模态概率建模的VADv2，以及我们最近提出的基于扩散模型的端到端策略DiffusionDrive；另外，我还会介绍我们最近公开的VLM+端到端的大模型Senna，分享我们对于自驾VLM/VLA未来方向的一些看法和思考。

中国科学院自动化研究所多模态人工智能系统全国重点实验室助理研究员戴星原

香港中文大学MMLab在读博士邵昊

05、自动驾驶世界模型技术研讨会

嘉宾阵容

西湖大学工学院博导、助理教授、人工智能企业 KMind 联创兼首席科学家于开丞

报告主题：《通向自主数据闭环的自动驾驶世界模型构建》

内容概要：

在自动驾驶领域，利用世界模型合成新数据已成为解决数据稀缺问题的事实标准。本报告将首先概述自动驾驶数据世界模型的最新行业进展。随后，我们将介绍自主智能实验室在构建基于世界模型的数据闭环方面的研究成果。最后，报告将探讨未来世界模型如何进一步助力实现更加自主的数据闭环系统。

商汤绝影智能驾驶高级总监武伟

报告主题：《「开悟」世界模型打造智驾「车云一体」数据闭环新范式》

内容概要：

数据闭环一直是自动驾驶研发上的重要环节，以往基于高精度传感器的数据采集和基于量产车的数据闭环都存在不少问题，需要全新的解决方案。近年来，多模态大模型的技术突破带来了自动驾驶世界模型的快速发展。在本次研讨中，将介绍商汤绝影“开悟”世界模型以及其长时、高分辨率、多视一致、可控等特性的实现方式，展示绝影「车云一体」数据闭环新范式，也会探讨世界模型的下一步发展方向和应用前景。

中国科学院计算技术研究所助理研究员闵称

报告主题：《从降低不确定性角度构建世界模型》

内容概要：

智能体面临两种不确定性：认知不确定性和随机不确定性。认知不确定性源于信息或知识的不足，可以通过获取更多信息来减轻或解决；而随机不确定性则源于真实世界的随机性，例如对未来可能性的预测。随机不确定性无法完全消除，但可以通过评估不同结果的概率来应对。对于自动驾驶而言，理解并有效建模这两种不确定性对安全决策至关重要，因为驾驶过程中需要应对不完美的感知数据并准确预测未来场景。本报告将从降低不确定性的角度出发，构建能够同时建模认知和随机不确定性的世界模型，以提升自动驾驶系统的性能和可靠性。

香港科技大学在读博士、上海AI Lab OpenDriveLab实习研究员高深远

报告主题：《构建开放场景中通用自动驾驶世界模型》

内容概要：

世界模型是真实世界的模拟，可以预测不同行动对应的未来状态，并反馈给智能体的训练和决策过程。在自动驾驶领域，世界模型具有解决高效错误重放、合成数据生成以及增强决策鲁棒性等核心问题的巨大潜力，受到了学界和业界越来越广泛的关注。

本次分享将着重介绍GenAD和Vista系列工作，为构建可在开放场景中泛化的通用自动驾驶世界模型提供了一条可行的技术路线。相关工作已先后被CVPR 2024和NeurIPS 2024接收。

上海交通大学计算机系2020级博士、上海人工智能实验室浦驾团队研究员周云松

报告主题：《基于仿真条件控制的自动驾驶世界模型》

内容概要：

可控的合成数据生成可降低自动驾驶研发中训练数据的标注成本。在本工作中，我们提出了SimGen，它通过混合来自模拟器和真实世界的数据来学习生成多样化的驾驶场景。SimGen在保持基于文本和模拟器布局的可控性的同时，实现了卓越的生成质量和多样性，并作用于数据增强，危险场景生成，闭环评测等应用。

06、大会日程

07、报名方式

峰会设置了三类电子门票，分别是免费票、通票和贵宾票。免费票申请需经组委会审核，通票、贵宾票均需购买。

持免费票可参加主会场（开幕式、端到端自动驾驶创新论坛和城市NOA专题论坛）。持有通票或贵宾票，除了可参加主会场，还可参加两场闭门技术研讨会（自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会）。详细权益，可通过文末左下角「阅读原文」，直达官网了解后，进行免费票申请或购票参会。

大家可以扫描下方二维码添加小助手“行远”申请免费票或购买门票。已添加过“行远”的老朋友，可以给“行远”私信，发送“自动驾驶”即可报名。