专栏名称: 佐思汽车研究
佐思产研致力于汽车、TMT、新能源(特别是新能源汽车、智能汽车、车联网)领域的产业研究、专项调研、战略规划和投资咨询服务。
目录
相关文章推荐
厦门日报  ·  女歌手全国巡回演唱会后被抓! ·  20 小时前  
厦门日报  ·  最新公告!新建厦门机场命名! ·  昨天  
煲都黎川  ·  Discovering the ... ·  昨天  
厦门日报  ·  余承东辟谣与刘亦菲恋情:我都没见过她 ·  昨天  
精明常旅客  ·  这些产品:清明 or 五一 or 端午不加价! ·  2 天前  
51好读  ›  专栏  ›  佐思汽车研究

理想汽车研究:理想AI布局的启示

佐思汽车研究  · 公众号  ·  · 2025-03-03 13:09

正文


佐思汽研发布《 2024-2025年理想汽车新四化布局分析报告 》。


理想汽车明确提出 “AI是未来的全部”,计划从汽车制造商转型为全球领先的人工智能企业。短期目标是成为中国空间智能领域第一、大语言模型前三;中长期目标是构建统一的 VLA(视觉 - 语言 - 行动)模型,实现 “硅基家人” 愿景,即 AI 成为家庭核心组织者。


自 2022 年起,AI 被列为理想公司战略核心,2023 年公开宣布转型,研发投入近50%聚焦 AI,目标通过 AI 技术重构汽车产品形态,从 “交通工具” 升级为 “空间机器人”,愿景升级为“连接物理世界和数字世界,成为全球领先的人工智能企业”。


佐思文章《 理想智驾,从追赶到领先 》一文中介绍了理想汽车在智驾领域的AI应用历程,本文将分析理想在座舱领域的AI布局,以及值得借鉴的地方。



基座大模型Mind GPT:车载AI的“超级大脑”


李想将基座大模型(Mind GPT)视为理想AI战略的核心。截至2025年1月,Mind GPT自2023年12月以来,已历经多次迭代,搭载车型超50万辆,日均处理交互请求1.2亿次,任务执行准确率达98.7%。在大模型上,李想提出了在未来几年内把大语言模型的基座模型做到行业前三的目标。


2025年1月16日,理想汽车OTA 7.0版本正式开启推送,最大的亮点是理想同学搭载的多模态认知大模型Mind GPT迭代升级为Mind GPT-3o 。自第一版模型Mind GPT 问世以来,理想汽车的大语言模型Mind GPT 经过多次迭代,如今已具备从感知到认知再到主动表达的智能体。


  • 2023年4月,Mind GPT 1.0发布;

  • 2023年12月,Mind GPT 1.0 随着OTA 5.0上车,并通过国家大模型备案,是最早的车端大语言模型之一;

  • 2024年8月,Mind GPT 2.0 推出,具备语言理解、知识问答,以及逻辑推理能力,模型架构上调整为 MOE (混合专家模型)加Transformer 的结构,模型规模翻倍;

  • 2025年1月,Mind GPT-3o 随OTA 7.0 推送,能听会看、有记忆(与Face ID与家庭账号打通, 能记住家人的偏好和要求)、善于推理(能理解并拆解复杂问题,还可将感知和思考的过程,通过动画直观展示,即【理想同学工作流】)、会表达(声音更拟人,支持数十种语气词;对话更口语化;多才多艺,能唱歌、学动物叫),并能调用300+工具(如查限行、搜索美团等)。


理想同学MindGPT-3o

来源:理想汽车


Mind GPT-3o作为一款强大的多模态端到端大模型,能够理解语音、视觉、语言等多种模态,并且以百毫秒级别的速度进行反馈,具备在单一架构内完成从精准感知外界信息,到深度认知理解,再到自然且准确表达的全链路能力,构建了一套完整且连贯的智能处理体系。凭借 Mind GPT-3o 的强大赋能,理想同学在智能交互等方面实现了质的飞跃。理想同学的记忆、规划、工具、表达能力得到全面提升。能为车内乘客完成任务、提升认知、提供情感陪伴。


  • 在智能交互体验方面,理想同学具备强大的感知与知识储备能力,即使在舱外也能准确回答各种地点相关的问题,还能敏锐感知到动植物、汽车、画作等,甚至对周边的建筑和地理信息也了如指掌。

  • 同时,理想同学不仅是智能助手,更像是贴心的家庭成员。它能够精准识别你和你的家人,记住每个人的偏好和特殊要求,让每一次的出行用车都变得更加轻松便捷,真正做到以你为中心。

  • 在日常生活中,它可以快速查询限行信息,清晰呈现日历安排,还能根据你的口味和需求筛选美团上的优质餐厅。不仅如此,它还能及时掌握本地热门活动资讯。


座舱进化:从“功能堆砌”到“主动预见”


理想智能座舱演进路线图

来源:佐思汽研《2024-2025年理想汽车新四化布局分析报告》


在 Mind GPT-3o的赋能下,OTA 7.0智能空间实现了全方位的进化。全新升级的 RGB+IR 视觉模组,丰富的多模态信息输入让理想同学不仅能够听得懂用户的指令,还能够看得见车内的情况。这一功能的实现,使得理想同学能够更好地理解用户的意图。比如,当车内乘客在讨论某个景点时,理想同学可以通过视觉识别和语音分析,快速为用户提供该景点的相关信息,包括介绍、导航等。


凭借 Mind GPT 的强大认知能力,理想同学还可以化身为家庭的 24 小时出行助手、用车助手和娱乐助手。它可以根据用户的日常出行习惯,提前规划最佳路线,并实时提醒路况信息。在用车方面,AI任务大师增加单次版,比如“一会儿停车关闭遮阳帘”。还支持延时服务,比如“前排空调开十分钟”。


在娱乐方面,理想同学可以根据用户的喜好,推荐适合的音乐、电影等娱乐内容。当用户想听某一类型的音乐时,理想同学可以迅速从海量的音乐库中筛选出符合用户口味的歌曲,并进行播放。


理想同学手机APP上线,从而让理想AI从车机扩展至手机、家居等场景,提供知识问答、视觉识别(如菜单、动植物)等通用 AI 服务。


Mind GPT-3o的领先之处


理想 Mind GPT-3o 的领先之处源于其全栈自研能力、场景化深度定制、混合部署架构及生态协同等。


01

多模态端到端架构:行业首个全链路整合模型

Mind GPT-3o的“多模态端到端一体化”架构是其最显著的差异化特征。与传统车载大模型依赖模块化堆叠(如独立的语音识别、图像处理模块)不同,Mind GPT-3o通过单模型实现语音、视觉、语言理解的深度融合,从感知到认知再到表达的完整链路在一个模型中闭环完成。这种设计大幅降低了系统延迟(响应速度进入百毫秒级别),并减少多模块协同带来的信息损耗。


02

数据规模与快速迭代能力

Mind GPT-3o的训练数据基于3万亿Token级别的多样化数据训练,覆盖用户习惯、道路场景、语音交互等多维度,远超行业平均水平。OTA 更新频率高,2024 年完成 17 次 OTA 迭代,平均周期 19 天,快速响应用户反馈,持续优化功能(如小红书内容调用、多模态指令融合),形成 “用户反馈 - 模型优化 - 体验升级” 的闭环。


03

智能驾驶与智能座舱的协同优化

  • 端到端架构协同:Mind GPT-3o 与智驾系统深度耦合,例如在高速收费站识别、环岛通行等场景中,通过VLM(视觉语言模型)辅助端到端模型决策,实现拟人化驾驶(如自动选择 ETC 车道、动态调整超车策略),而传统车企的座舱与智驾系统多为独立模块,协同能力较弱。

  • 全场景覆盖:支持 “车位到车位” 导航、AI 推理可视化等功能,结合智驾总里程 29 亿公里的数据积累,形成从感知到决策的完整闭环,相比仅聚焦座舱交互的竞品,具备更完整的出行生态整合能力。


来源:理想汽车


04

全栈自研架构与深度场景定制

  • 技术路径:理想是首个推出全自研多模态认知大模型的车企,采用自研的 Taskformer 神经网络架构,实现语音、视觉、文本等多模态数据的统一特征表示,避免了依赖第三方模型的系统割裂问题。

  • 场景聚焦:针对车载环境深度优化,覆盖 111 个领域、1000 种以上专属能力(如语义理解、多语种交流、模糊感知等),尤其在家庭场景下的空间指令执行(如后排屏幕隔空操控、声纹识别)和个性化服务(如儿童模式、节日问候)方面表现突出。


05

云端 + 端侧混合部署的灵活性

  • 算力效率:通过云端 GPT 与端侧 NPU 的推理负载分配,降低对硬件算力的依赖,使老车型也能流畅运行大模型功能,相比部分竞争对手的纯端侧部署(需依赖 8295 芯片及Orin算力),兼容性更强。

  • 隐私与性能平衡:关键任务(如导航、车控)由端侧处理保障隐私,复杂任务(如知识问答、娱乐搜索)调用云端算力提升体验,兼顾效率与安全性。


06

复杂任务处理能力:超越指令执行的“主动助手”

Mind GPT-3o的突破在于将大模型从“问答工具”升级为“任务规划中枢”,其核心能力包括:


  • 复杂问题拆解:例如用户提出“周末全家去郊游”的模糊需求,模型可自动分解为路线规划、景点推荐、餐饮预订、天气预警等子任务,并协调车载系统与外部API(如美团、高德)完成执行。

  • 工具链集成:内置限行查询、日历管理、故障诊断等20+垂直场景工具,且支持第三方服务扩展。


来源:理想汽车


《2024-2025年理想汽车新四化布局分析报告》目录

页数:270


01

理想简介和综述

1.1 理想汽车简介

理想汽车基本信息

理想汽车发展历程

理想汽车销量和营收情况(2024)

理想汽车销量细分和毛利率情况(2024)

理想汽车的工厂产能构建

关键零部件制造和研发布局

研发投入及方向(2023)

理想汽车 对外投资


1.2 理想汽车 组织管理和渠道建设

理想绩效管理:从OKR升级到PBC

全面引入IPD流程管理

矩阵组织管理

矩阵组织管理

营销渠道

零售门店发展

全面学习华为

理想调整组织架构,理想L6发布

理想汽车组织架构调整:整合产品与商业

理想汽车组织架构调整:整合产品与商业


02

理想产品规划和发展战略

2.1 理想汽车 车型规划

理想-车型规划汇总 & 产品型谱

理想汽车车型平台规划

理想上市车型介绍

理想发展规划


2.2 理想汽车 重点车型和供应商

理想重点车型的配置对比

理想车型定位成功之处

理想L8/L9的主要供应商-智能网联部分

理想L8/L9的主要供应商-智能座舱部分

理想L7的智能座舱参数和供应商

理想L7智驾配置和供应商

理想L7其他供应商


03

理想汽车 架构和域融合

理想汽车E/E架构演进Roadmap

理想汽车LEEA2.0 E/E架构覆盖车型销量及渗透率

理想 LEEA2.0 & LEEA3.0 E/E架构功能模块和供应链总结

理想LEEA2.0供应链——自动驾驶域控

理想LEEA2.0供应链——中央域控制器(XCU)和车身域VIU

理想LEEA2.0供应链——TSN协议栈

理想LEEA3.0架构设计:中央算力平台+4个区域控制器

理想LEEA3.0供应链——CCU中央计算机(1)

理想LEEA3.0供应链——CCU中央计算机(2)

理想LEEA3.0供应链——区域控制器

理想LEEA3.0供应链——PCIE Switch & TSN Switch通信架构(1)

理想LEEA3.0供应链——PCIE Switch & TSN Switch通信架构(2)

理想LEEA3.0供应链——SOA软件,多层级服务的定义和部署

理想LEEA3.0供应链——实时操作系统 LiOS(Li auto OS)


04

理想汽车 基础软件

4.1 理想汽车 软件布局

理想汽车软件业务布局

理想汽车研发中心

理想汽车智驾软件业务布局

理想汽车Li OS


4.2 理想汽车 OTA

理想汽车OTA发展演进

理想汽车最新OTA技术特点

理想汽车OTA升级要求

理想汽车OTA升级历程:理想L系列车型

理想汽车OTA升级主要内容

理想OTA6.0:AD MAX版本全量推送无图NOA功能

理想同学支持场景创建

理想L系列/MEGA优化人机交互、智能驾驶NOA等

理想娱乐系统大升级


05

理想汽车 云端 数据和大模型

5.1 理想汽车 云服务平台

理想汽车云平台布局

理想端到端智驾的云端世界模型

理想车联网云

理想数据存储方案

理想智算中心进展


5.2 理想汽车 大模型

理想汽车AIGC应用:大模型在自动驾驶的应用

理想汽车AIGC应用:智能空间3.0接入Mind GPT

理想同学:构建多重场景

理想Mind GPT:作为大模型核心构建AI Agent

理想Mind GPT:多模态感知

理想大模型训练平台采用4D并行方式

与英伟达合作落地推理引擎

Mind GPT获国家备案

理想Mind GPT 的迭代历程

理想Mind GPT-3o的功能


06

理想汽车 SOC和域控

理想汽车座舱平台演进

理想汽车座舱SoC演进

理想ONE座舱芯片

理想Li Ai OS

理想汽车智驾SoC:开发背景和进展


07

理想汽车 智能座舱

7.1 理想 座舱平台

理想汽车座舱配置

理想汽车智能座舱演进

理想汽车舱驾融合规划

理想下一代座舱软件系统

理想Li AI智能座舱空间系统

理想汽车智能座舱供应商系列


7.2 理想汽车 座舱设计

理想汽车主要新车型座舱设计特点:2024年

理想L6智能座舱设计

理想MEGA智能座舱设计

理想MEGA智能座舱配置分析


7.3 理想汽车 多模态交互

理想智能座舱方案:理想车机系统

理想舱内特色多模态交互应用

理想智能座舱:多模态感知+Mind GPT

理想多模态交互 OTA 内容汇整

理想AD Max新增AI智能蓝牙钥匙等功能


7.4 理想汽车 智能语音

MindGPT赋能下的理想同学模块设计

语音标杆车型:理想 MEGA Ultra

Mind GPT在理想同学的应用场景

理想同学技能(1)

理想同学技能(2)

理想同学技能(3)

理想汽车语音OTA详情


08

理想汽车 舒适和音响系统

8.1 理想汽车 汽车音响

理想不同扬声器车型销量

理想L6音响分析

理想L系列音响

理想Mega音响分析

理想新一代音响系统代表车型

理想汽车升级车内娱乐体验


8.2 理想汽车 舒适系统

理想车载香氛及空气净化系统装配情况

理想香氛与空气净化系统

理想 全系车型 空气净化与香氛系统对比

理想商城上架智能儿童安全座椅


09

理想汽车 车载显示

9.1 理想汽车 多屏联屏

理想多/联屏装配数据:车型/销量

理想多/联屏方案代表车型

理想座舱新型显示


9.2 理想汽车 XR/VR

理想车载XR布局

理想汽车雷鸟Air AR眼镜特点

理想汽车最新AR眼镜Rokid Max特点


10

理想汽车的车联网 信息娱乐系统

10.1 理想 车载信息娱乐

理想信息娱乐系统迭代历程

理想最新一代信息娱乐系统

理想车载信息娱乐系统代表车型

理想下一代信息娱乐系统

XX音乐登陆理想汽车


10.2 理想 车载生态

理想手车互联:与多家供应商合作实现手机控车

理想车表互联:与多家供应商合作实现手表控车

理想车家互联:与手机厂商合作实现车家互联


10.3 理想汽车 车载游戏

小鹏&理想游戏上车布局

理想公布5A级电竞房模式硬件配置


11

理想汽车智驾系统

11.1 理想 ADAS与NOA

理想智能驾驶平台演进路线

理想ADAS迭代路线

理想NOA迭代历程

理想智能驾驶1.0时代硬件迭代及供应商

理想 AD max系统及代表车型理想L9

理想AD Pro系统

理想智能驾驶2.0时代 :从AD MAX 2.0到AD MAX 3.0

理想智能驾驶2.0时代:AD Max3.0架构

理想智能驾驶3.0时代:端到端+VLM双系统架构

理想自动泊车系统发展路线

理想智能泊车与召唤

理想加速L3/L4布局,未来将向AGI延伸

理想L4自动驾驶规划


11.2 理想智驾技术布局

理想智能驾驶团队及产品开发模式

理想技术布局:芯片

理想技术布局:数据闭环

理想智能驾驶算法:NPN

理想智能驾驶算法:TIN

理想智能驾驶算法:Occupancy占用网络模型

理想AD3.0算法架构——以大模型为主的端到端算法架构

理想汽车感知算法:BEV+Transformer+Occ

理想汽车规控算法:时空联合规划+MPC模型

理想自动驾驶训练平台:Poseidon训练平台

理想技术布局:数据闭环

理想L4级自动驾驶技术底座


11.3 理想汽车 端到端

理想汽车端到端方案演进

理想汽车端到端方案演进 :系统1+ 系统2

理想端到端方案演进 :世界模型的重建+生成

理想汽车智驾端到端算法底层技术

理想端到端方案:理想DriveVLM大模型-架构

理想端到端方案:理想DriveVLM大模型-渲染效果

理想端到端方案:理想DriveVLM大模型-BEV和文本特征的处理

理想端到端方案:实现L3级别自动驾驶

理想端到端方案:从AD Max3.0开始构建完整大模型

理想智驾训练历程和算力


11.4 理想汽车 2024智驾进展

理想将BEV感知架构与Lidar融合,提升AEB性能

理想推送全方位低速AEB功能,针对泊车和低速行车场景

理想汽车的无图 NOA 推送 AD Max 用户

理想智能驾驶出行报告

理想与清华开启智能汽车技术研发深度合作

理想智能驾驶2024年累计里程


12

理想汽车的电动化

12.1 理想汽车 电驱动和动力域

理想汽车电驱动系统:自研自产策略

理想纯电平台电驱主要技术发展历程

理想汽车:800V SiC 高压电驱系统

理想汽车碳化硅模块、电驱项目投产


12.2 理想汽车 电动化布局

理想车型动力性能参数对比

理想电动技术布局

理想汽车第一代增程式电动解决方案

第二代增程式电动解决方案

第二代增程电动X平台:底盘控制系统

第二代增程电动X平台:其他特点

高压纯电Whale/Shark平台

理想汽车补能方式

理想汽车纯电战略

理想汽车电动化相关动态

理想汽车与XXXXXX建立联合实验室


12.3 理想汽车 混合动力和增程

理想-混合动力路线规划







请到「今天看啥」查看全文