2024年12月25日~27日每晚8点,理想推出3期2024理想AI Talk,腾讯新闻科技主笔张小珺,深度对话理想创始人、CEO李想,理想智能驾驶研发副总裁郎咸朋,理想空间AI负责人陈伟。
李想时隔9个月重回公众视野,分享关于AI完整技术与产品观。李想表示,AI对于理想意味着未来全部,将全力以赴迈向成为全球领先AI企业的目标,对内、对外明确传递理想All in AI的决心与气魄。
李想与团队成员,畅谈对AI、自动驾驶最新思考,分享理想智驾、理想同学等最新进展,披露理想为实现AGI的战略路线图,最终将打造硅基家人,推动AI普惠到每个家庭,完成创造移动的家、创造幸福的家使命。
本期长期主义,选择李想3小时对谈完整版、理想AI Talk访谈实录02、03,腾讯科技、理想汽车发布,六合商业研选精校,分享给大家,Enjoy!
2024年12月,张小珺与理想汽车CEO李想有一场对话。此时,他们决定车机助手理想同学推出手机版APP,并于此前做了基座大模型,两者相加约等于Kimi。
这意味着,人们认知中的新能源电动车企业,宣告要进入与字节豆包、月之暗面Kimi、腾讯元宝、百度文心一言等个人助手之战。这场原本已然红海的基座大模型+个人超级助手商战,竞争烈度更大。
很多人脑海中,个人超级助手与智能驾驶,是截然不同的两件事,产品不同,底层架构无法打通。
李想不这么认为,在他看来,OpenAI定义的第三阶段智能体、自动驾驶定义的第四阶段自动驾驶,会在相近时间点交汇,合并到统一架构上。
各异的企业将汇入同一片赛场,基座模型是AI时代的操作系统+编程语言,基座模型所构建出的AI超级产品,会是新一代入口,它会在所有设备之上,在所有服务之上;如今这些企业,都在争夺AGI
L3与自动驾驶L4的门票,这会是双边的iPhone 4时刻。
全球看,对AI的探讨,正从技术认知转向产品构想。对话中,这位非技术背景、被认为在产品上有天赋的创始人,复原这2年理想关于AI完整的技术与产品观。
他首度谈了Mega失利、苹果放弃造车、雷军造车成功、理想会做机器人、怎么管理00后等各种话题。
张小珺:
别人都在做纯电,你在做增程;现在很多人开始转增程,你怎么不想造车、要做AI企业?
李想:
造车肯定是要造的,大家经常讲:电动化是上半场,智能化是下半场。
我认为智能化,讲的不是传统软件智能,而是真正的AI,这是造车往下延续的必经之路。汽车将从工业时代交通工具,进化成为AI时代空间机器人。
张小珺:
我看了一下你第一次对内说,2030年要做全球领先的AI企业,是在2023年1月,此时ChatGPT刚好诞生2个月。你这是跟风吗?
我们每年春季战略发布,起源于上一年9月,在北京雁栖湖开的每年一度内部战略会。
2022年9月,我们已经确定,要把AI包含自动驾驶作为真正重要的方向,这是未来竞争关键。
2023年初,发布战略时,我们做了根本性变化,把AI从隐藏战略,变成开放的阳谋战略。这样,才能吸引足够多人才。
OpenAI发挥了非常大作用,把全新的AI时代打开。我们对AI内心所有想法、所有期盼,不用再藏着,应该拿出来正面讲。
李想:
追溯到这一次创业开始,我脑子里看到很重要的事:如何用全新技术,改变物理世界发生的一切?
我在做汽车之家,在线上,我们成了全球最大汽车网站。汽车之家有很多遗憾,比如我们做的汽车电商类业务,一直没有成功,我们想改造整个物理世界,包括一辆车从制造、仓储、库存、物流到体验。
我们会发现,除了在线上多花一份钱,并没有对物理世界产生有效改造。
我做理想汽车,很重要的一点是,必须借助最新技术,对物理世界进行改造。
张小珺:
你是想做一家AI企业,还是想通过AI赋能电动车?
李想:怎么来讲,汽车是物理世界AI最大的应用,如果看清楚这一点,我们应该是一家AI企业。
团队总问我,我们Logo后边写理想还是理想汽车?我们讲理想汽车是为了方便跟外界沟通与宣传,Logo从来没把汽车加上去。
张小珺:
你可以说,你要做的是一个AI技术驱动的电动车企业,或者一个拥有AI技术的自动驾驶企业,为什么一定要是AI企业,本质区别是什么?
李想:
做汽车之家,有我一生中最大的遗憾,汽车之家是我第二次创业。
第一次创业,泡泡网赶上PC互联网时代,那时我不懂什么是创业,刚高中毕业,就开始做这么一个网站,错失很多好的机会。
做汽车之家,我非常看中汽车这样一个新兴行业。我们当时做过分析,中国1年只能卖200~300万辆车,到今天1年卖接近3,000万辆车。
但汽车之家发展成功一个重要因素是,我们率先做移动互联网应用与业务。我们做了几乎全世界最早Web网站、Windows Mobile版、iOS版、安卓版。
我们非常好抓住移动互联网窗口,很长一段时间,你看身边朋友,尤其男同胞,抱着汽车之家看车、买车,是他们生活重要的一部分。
2013年,汽车之家IPO后,到2015年我决定离开汽车之家,有一个非常大的遗憾。
2009年,汽车网站竞争就结束了,后面几年过得挺轻松的。
我还有更多能量,团队还有更多能量。我们在移动互联网时代,选了一个非常垂直的领域。你做得很好,某种程度,你可能为了一棵树,错过了一个森林,这是我最大的遗憾。
选择第三次创业,很重要一点是:我要选择一个森林,我要做那个森林里最大的。无论多么难,无论需要我经历什么样困难,我绝对不止做一棵树。
张小珺:
你是觉得把它叫AI企业,是更大的故事、更大的梦想?
李想:
不是更大的故事,如果你看我们到底在做什么,你就会相信。
我们是全世界第一个做基座模型的车企;端到端与VLM,从最开始论文,到技术研究,到最后研发与产品交付,也是全世界最早做出来的。
我们不仅在做智能驾驶,还有理想同学、智能商业、智能工业团队。
注:理想AI产品,包括2个C端产品,智能驾驶与理想同学;2个B端产品,智能商业与智能工业。
只是AI,如果是原来规则算法、知识图谱,大家觉着没什么希望。
大家相信AI,但技术是错配的。它用了不是真正符合AI的方式,这都是进展。
我们可能吃到第8个包子,吃饱了,但前面每个包子都有价值。
张小珺:
我还是不能相信,你从创办理想第一天,就想好要做一家AI公司。你确定当时这么想吗?刚创业就觉得AI时代要来了?
我们从最开始,也没有把它当成传统汽车做。为什么理想ONE只有一个车型?是我把它本身看成一个数据与软件的集成。
张小珺:
乔布斯说如果硬件是产品大脑与肌肉,软件是灵魂,你表达的也是这个意思?
我最开始创业,投资人经常问我一个特别有意思的话题:凭什么是你?为什么你能做出来?那时我们还没有产品出来。
我当时讲了一个最重要的观点,我说:我会比传统汽车企业更懂怎么做互联网与大型软件,我会比互联网与大型软件公司更了解怎么制造一辆车。
张小珺:
有人2023年问一些理想员工,你相信理想是家AI企业吗?他们都说不相信。
既然你都不能让你雇的人相信,怎么让更多人相信,怎么让大众相信?
我们做增程时,如果你问我们员工,这辆车成功率有多少,销量有多少?
当时我们员工填最多的是,1个月能卖1,500辆;大部分员工,认为1个月只能卖几百辆。大家并没有体验过新技术,没有看到这个技术能带来的价值。
这可能真的是创业者与大部分人的很大不同:你会相信看着不是明白、不是清晰的事。
张小珺:
你第一次用ChatGPT是什么时?感受是怎么样的?
到今天为止,我跟身边很多人的判断不一样。我认为OpenAI是非常、非常了不起的公司,甚至它了不起来的程度,超过当年谷歌之于互联网了不起的程度。
张小珺:
为什么这么说?OpenAI未来会长成什么样,会超越谷歌吗?
李想:我觉得基本是确定性的,我看一家公司,不会单独从技术看。
第一、我会看这家公司对行业标准的定义,很多时候,大家忽视这是最重要的,谷歌当年在搜索上定义了很多行业标准。
第五、是商业化能力。商业化能力分阶段,今天是不是它一定要获取多少收入,没那么重要。
OpenAI做了当年谷歌做的最重要的事,很多人忽视谷歌当年的成功,是源于谷歌前CEO 施密特Eric Schmidt加入后,在商业上的巨大成功,是谷歌当年拿下AOL首页。
百度当时很重要的成功,也是收购hao123,作为重要入口。
如果当时,美国超过50%的人,上网首页是谷歌,谷歌搜索是排他性竞争。
今天,OpenAI同样很厉害,拿下2个超级巨头:一个微软,一个苹果,这非常了不起。
张小珺:
在你看来,OpenAI一定会成为下一个入口吗?
李想:
我就拿数据看,OpenAI在这些AI的聊天产品里,如果看全球,基本占了80%份额。最新数据1个月有36亿访问量,离最近的是Gemini,应该是2亿~3亿。
张小珺:
如果让你做OpenAI CEO,你会比Sam Altman做得更好吗?
李想:
不会,我觉得Sam Altman做得非常成功。
张小珺:
如果你是OpenAI CEO,你现在会做什么?
李想:
最大一个挑战是,今天还是OpenAI定义的AGI L1阶段,聊天机器人;L2阶段,是他们最近在推广宣传的,包括12天直播,是推理者阶段。
大家相信2025年最重要的是,跑在头部的企业,能某种程度实现L3阶段,Agent智能体。
现在,OpenAI非常好讲明白,按照这个定义做了,聊天机器人最好的产品体验。
L1
聊天机器人Chatbots:
AI具备基本对话与交互能力,能与用户进行流畅对话。
L2
推理者Reasoners:
AI将能解决类似人类博士水平的复杂问题,展现强大推理与问题解决能力。
L3
智能体Agents:
AI能独立采取行动,不仅能思考,还可以在没有人类持续监督情况下执行任务。
L4
创新者InnovaTors:
AI能协助发明创造,推动科技进步,具备创造性与创新能力。
L5
组织者Organizations:
AI将能执行整个人类组织的工作,展现出高度自主性与策略性。
李想:
对。L2阶段不是普通人使用,Pro卖到200美元,要么To B用,要么是大C、专业用户用。
到L3 Agent阶段,才是真正iPhone4时刻。普通老百姓都能用,它能独立、持续完成任务,不用靠密集提示词的方式。这时产品应该是个什么交互,这是所有头部企业都应该认真思考的。
李想:
美国可能更早一些,中国能力足够的Agent,应该在3年之内实现。
张小珺:
我们来谈谈你们2款AI产品,理想同学,它是个人助手;一个是智能汽车。
理想同学以前是车机的个人助手,它现在要走出车门,进入手机变成APP,未来会上更多终端。
这意味着,你们电动车企业,要进入通用个人助手这场红海战役,要跟豆包、Kimi、ChatGPT竞争,是这样吗?
李想:
如果我们是纯硬件公司,可以符合你说的定义。
苹果不是只卖Mac,才有后面可能性。这个可能性,不是iPhone出来后发生的,是在Mac变成透明壳那一刻就在发生。
华为不只是运营商,后面一切是它从运营商做到相对稳定阶段,就开始产生。
小米不只是手机企业,它有IoT,有自己生态,甚至也有汽车。
这些企业,不能以一个硬件来定义它到底是什么企业。硬件是它支柱业务,是起点。今天每一家企业,都应该是家AI企业。
如果在智能手机时代,最重要的是操作系统、应用商店、云服务。
最开始大家做触屏手机,中国,我印象有非常多家触屏手机,甚至很多品牌也都1年卖几千万台。
但到了操作系统、应用商店、云服务竞争的智能手机时代,这些企业要有庞大的大型软件能力,很多时候硬件能力,供应商就能解决。
我们做硬件,是为了更好控制硬件体系、性能再高点点。
大型软件不一样,不是所有人能做操作系统,不是所有人能做大型云服务,这就变成更大挑战。
回到AI也一样,今天你能看到几百家电动车企业,是中国有非常完善供应链。
李想:
至少我们做了,至少我们一直在做基座模型,无论多么难,非常坚定。
我认为,基座模型是AI时代操作系统+编程语言,你就知道它有多么重要。
基座模型所构建出的AI超级产品,会是新一代入口,它会在所有设备之上,在所有服务之上。
张小珺:
把理想同学+Mind GPT加起来,约等于Kimi,可以这么通俗理解?
张小珺:
理想同学从车机进入手机,这是战略级决定,还是你们只是想试试看?
站得很远看,一个有效大模型产品,尤其你在掌握基座前提下,会在所有设备、所有服务之上,这是我相信的一点,否则它不是AI。它发展到智能体,能自主使用所有设备、服务。
站在近处看,我们很多用户、孩子,一上来接触的AI是理想同学。很自然,我为什么不把这个东西,也同样放在他们日常使用设备上。
很多用户的孩子,在使用完车内理想同学后,拿着手机也喊理想同学,这是真实需求场景。
我们可不可以先把100多万用户、家庭,这300~500万人,让他们用上非常好的,在车上、手机上、电脑上、后面可能出现在眼镜上,体验一致的AI产品,这是必须要做的。
张小珺:
理想同学会存在收集用户数据、用户隐私的问题吗?
李想:
不会。当你真正预训练、后训练,你会发现跟原来互联网不一样,我们并不需要这些东西。比如,预训练更多是从公开数据集收集。
如果未来让用户使用得更好,会建立记忆系统,记忆系统会把用户记忆转成Token。它既不是比特,也不是传统文字或声音记载,大家完全不用担心。
大家今天如果担心AI隐私问题,还是对AI技术本身不够了解。
张小珺:
对话类个人助手,已经非常红海,你怎么看在这片红海市场中战争?
李想:
今天是非常初期阶段,如果讲第一个明确阶段,还是人人可用的To C智能体出现,也是OpenAI定义的L3阶段,今天在尝试中。
今天大家做的所有事情,是为了拿AGI的L3与自动驾驶L4的门票。
张小珺:
在我脑子里,理想同学作为个人助手,与汽车智能驾驶,是两件事,这是2个产品,支持他们的是两种技术架构,为什么给我感觉,在你脑子里,它们是一件事?
李想:
这2个领域都做,我们看到更有意思、让我们更坚定去做的机会。
今天我们做的理想同学与自动驾驶,按行业标准是分割开的,处于早期阶段:
我们在做的Mind GPT理想自研大模型,大家叫LLM、大语言模型,它叫语言智能。
我们在做的自动驾驶,李飞飞定义叫空间智能,我们内部叫行为智能。
只有你真正在这个领域大规模做,才知道这2个,有一天一定会连在一起。
如果一个人只有语言智能,他足够聪明,但不能行动。如果一个人只有行为智能与空间智能,他像一个普通工种。一个人什么呢?是这几个结合。
我们认为,基座模型到一定时刻,一定会变成VLA,Vision Language Action Model,一种结合视觉、语言、动作的多模态模型。
语言模型也要看三维世界,也要通过语言、认知理解三维世界。
三维世界不只有图片,或者用Diffusion、生成方式就可以,它并不能还原真实物理世界,需要向量。
自动驾驶也一样,它真正变得更强,走向L4,是它要有极强认知能力。
当这些东西发生变化,它能够有效理解这个世界,不只是端到端背后的压缩记忆,这是我们看到的一个变化。
我对团队一个要求:至少在中国范围内,未来几年,必须保证大语言模型的基座模型是行业前3。你需要什么样的训练算力,我们愿意投资。要真正跟头部企业PK,去竞争,把能力构建起来,不只是在汽车行业里比一比。
对我们最开始做的端到端+VLM智能驾驶的架构,包含下一代研究工作,我们如何在空间智能里,保证在中国是最领先、第一的地位,这非常之重要。
我相信这个时间点会非常相似,空间智能实现L4,语言智能实现Agent时,一个大概率是,这2个会变成一个模型。
李想:
是视觉Vision、语言Language、行动Action,它跟人一样,变成更大的模型能力。
李想:
智能驾驶所获得的数据,可以为语言模型或者下一步基座模型,构建三维向量空间的能力。
举个例子,我们在VLM使用中,会遇到一些问题,今天VLM是从大语言模型基础上做出来的。
做VLM这些基座模型,它也会喂几亿、甚至几十亿张图片,这些图片是二维的,在三维向量空间里,比如我们做自动驾驶,它可以通过这个画面看到:哪里是公交车道,公交车道提示是什么,什么是潮汐车道;甚至能认出交警,这个交警在干什么;它并不知道具体位置。
是端到端的基座、与VLM基座,是2个不同基座,它俩只能互动,不能通过端到端确定位置。
这也是我们看到说:最终,它应该像人类一样,一套大脑系统,既能处理语言,也能处理图像,处理图像时,人是具备三维向量空间的能力,能调用自己行动。
接下来也能看到我们一些论文,我们如何用三维向量空间,包括用高斯球方式,给语言模型具备三维向量空间的能力。
张小珺:
它最终会合并统一到Mind GPT基座模型上?
我们肯定会往语言模型放三维向量Token,现在已经开始尝试,做预训练。
张小珺:
很多人说你是超级产品经理,能不能从产品角度讲,随着AI能力,从L1到L5,按照OpenAI定义标准演进,你对产品是如何构想的?
李想:
产品是把用户需求、与你背后所有能力进行结合。
好的产品经理是,我对需求了解得足够清楚,我对能力了解清楚,2个交集越大,产品价值越高;交集越小,产品价值越低;或者浪费越多,内耗越多。
今天哪怕我在公司想推动AI,最重要的是,让大家对很多东西理解变容易。
增强我的能力,意味什么?意味着它是我的一个辅助,最后决策权在我这。
我可以拿Midjourney画一幅画,最后还要拿Photoshop修改一下才能出版。
我可以拿理想同学生成一篇文章,这个文章不会直接发到公众号,还要进行文字整理。
包括L3智能驾驶,我们叫有监督智能驾驶,需要我在车上监督,我来进行最后兜底。
如果你能特别好使用AI这方面能力,它让我变得更方便、效率更高。
随着它能力提升,随着人类对它信任,到第二个阶段,是智能体所描述的阶段。
我只要给它发任务,甚至可以发连续任务,它可以独立完成,对结果承担责任。
比如,我可以跟一辆L4车讲,你要帮我接孩子,我不需要坐在车上,它可以到学校帮我接孩子,进行面部识别,打开门,让孩子上车,再完成下个任务,送孩子学游泳、学乐高。
它可以帮我做上周工作总结,发给我所有减一层管理者,这是第二个阶段。
这个阶段,比较好的状况是,它会变成大规模应用,是真正iPhone4阶段。
汽车企业,只有实现按自动驾驶行业标准的L4,才是真正的iPhone4阶段,今天还不是。
L1
辅助驾驶:
系统能持续执行车辆横向或纵向运动控制中一个方面,如自适应巡航控制、车道保持辅助。
L2
部分自动驾驶:
系统能控制车辆横向与纵向运动,驾驶员必须始终监控驾驶环境,准备接管。
L3
自动驾驶:
特定条件下,系统可完成所有驾驶操作,驾驶员需要在系统请求时接管。
L4
高度自动驾:
定义操作区域内,系统可完全独立操作,即使遇到复杂或紧急情况,无需人类介入。
李想:
如果实现L3,更像黑莓阶段。方向盘在上边,就跟键盘在上边一个道理。
第三阶段,是我想的终极阶段。我们要创造移动的家,创造幸福的家,我在内部叫硅基家人。
我不需要再给它任何指示,不需要分配任务,它是家庭成员,甚至是家庭重要组织者。
它不但了解我,还了解我孩子,了解我身边朋友,甚至比我还了解。
它更多记录下的是事实,我很多时记,录的是一种感觉与一些被压缩的记忆。这时它会主动干很多事,可以自主帮我把家管理好。
我作为一个人,很重要的是记忆。我的记忆是我的模型,它也在不停训练,变得更强。
很重要的一点,我的记忆会被它得以延续,可能我肉体不存在,我的记忆会变成它的一部分。我后代想了解我,很容易,只要跟它聊,就像跟我聊,没区别。
如果按照OpenAI定义,到AGI,它本身是组织者。它不是只有能力,必须有智慧,它会是人类优质智慧的汇集之河,不只是人类知识与能力的汇集之河。
张小珺:
产品形态上,硅基家人,是你脑海中构想的最终产品?
李想:
对。我最兴奋的是,我与我们团队,能在有生之年实现第三阶段,我希望是通过我们的手实现。
哪怕最终各种遗憾,没有通过我们手实现,我希望看到有最顶尖企业,把这个阶段在我们有生之年实现。
张小珺:
如果你最终目的是硅基家人,它不适合叫理想同学,会改名吗?
李想:
很快,大家能看到我们允许每个人创造自己的理想同学。
如果它不是家人阶段,不要强努着给它一个家人阶段的名字。
张小珺:
这类对话类产品,已经高度同质化,你们优势是什么?
李想:
今天不能讲同质化,真正大规模To C的关键节点,是在智能体实现阶段,今天大家都有机会。
1
、相比一般创业公司,我们有100万家庭用户的基础,有启动量。
2
、大语言模型产品与基座方面,我们是跟随者,跟随要有目标。
我们从10名开外,先进入第5,再进入第3。这也是我们后边要设定目标,与最好、最优秀的选手,进行对比的有效工作方式,按照这样目标有效投入。
3
、空间方面,包括端到端,今天大家听到各种各样做机器人、具身智能的公司,讲系统1、系统2,大家可以回头看一看这些论文,最早是我们自动驾驶研究团队做的。
在空间智能或行为智能方面,我们对自己要求是必须保持第一。
张小珺:
你刚才说产品是要技术能力匹配产品需求,你今天是对产品需求认知更深,还是对技术能力认知更深?
大模型到来以前阶段,我们通过编程、甚至规则算法做硬件,本质上我们提供的产品是功能,这个功能有体验。比如这是冰箱,它是功能,冰箱放在不同地方,体验是不一样的。
这时企业很重要的竞争是,你提供什么样功能,这个功能带来的体验,再加上品牌。
无论你是互联网产品,还是硬件产品,或者智能硬件产品,你提供软件功能,又提供硬件功能,这是这个时代的竞争。
无论是你通过买不同产品获得体验,还是在供应商那看到新东西,或者自己研发,可以通过体验判断功能价值。只要你愿意做,获得功能与体验没那么难。
我们为什么率先出理想汽车iOS APP,是我从iPhone1开始没有短信,要通过贴东西才能用SIM卡。那时很多人嘲笑,李想你小白鼠,为什么要用这些东西?
可能大家不知道,我是中国第一辆雪佛兰Volt,这个通用增程电动车的使用者。很贵,那时40多万买了一辆车。大家会觉得我是小白鼠,小白鼠一个好处是,能获得优先选择权。
我会比所有没体验过Volt的人,更了解增程到底什么样,还有做的不成功的增程,为什么不成功。它的小电瓶与大电池,没有连接在一起。你只有体验,能获得这样一个认知。我说这是功能时代。
从AI开始,这些头部AI企业必须搞研究。研究工作不是技术本身,还包含比如它跟人类记忆的关系,这样才能对技术方向有效判断。
有点像月之暗面创始人、CEO杨植麟讲的那句话,屎上雕花。
如果你想做AI助手,想做基座模型,想做L4自动驾驶,就不一样。
张小珺:你怎么看杨植麟说的模型即应用,也就是好的产品是在模型能力提升过程中沿途下蛋,你认可他的这种产品观吗?
大家最开始说:OpenAI做聊天工具,我们可以做搜索。你今天看,OpenAI在做搜索,OpenAI会进入一个个细分领域。
原来讲功能,今天是能力。能力有了,任何能力所能解决的问题,都能实现。
张小珺:
很多人认知你,觉得你是非常实用主义的人。
大家在追求做电车的时,你在做增程,为什么今天对AI技术这么激进,李想有理想吗?
我第一次创业,泡泡网做的不成功,起了大早、赶了晚集。
我后来真正明白一点,是中国古人讲天时、地利、人和,非常之重要,这三个有清晰顺序。
排第一是天时,商业社会什么是天时,天时是技术,是我们对技术有效使用。
作为创业者,如果我做一辆燃油车,还做10挡变速箱,我仍然卖不到奔驰、宝马任何一个品牌在中国1/10的销量。
我如果做增程车,赋予非常好的软件体验与部分AI体验,我可以在很短时间追上奔驰、宝马、奥迪销量,甚至在可见的未来1~2年,超越他们,这是重要技术变革点。
人类跟我们相关最重要的技术变革:一是能源,二是信息。
天时、地利、人和,第一重要是技术,第二重要是地利,在哪创业。
你不是主流语种,没有足够庞大市场,没有足够多人才与这方面投入,包括人才是否经历上一个时代能力的积淀。
技术第一重要。进入汽车行业,很多人说,巨头们都厉害,几十年没有真正大厂出现,为什么觉得你有戏?
还是我说的,我比汽车厂商更知道怎么做大型软件,比互联网公司更了解汽车,做了10年汽车之家。
拿汽车行业举例,这是我相信的东西:时代演进方向BT—IT—DT—AI。
奔驰发明汽车,真正汽车行业进入老百姓家是福特开始。
福特跟其他作坊型汽车厂一个根本差异在于,建立流水线与生产线。它用了几分之一的价钱,可以让普通美国老百姓拥有福特T型车。
我们内部把流程的简称叫BT,是流程,这是第一阶段。
后来丰田又把流程发挥更加极致,美国到20世纪70年代还成立流程协会,流程协会诞生了后边大量软件公司。
到第二个阶段,是IT出现,是软件,是以控制为目的的软件出现。
我们在建常州第一个工厂时,没有精力自己写工厂软件,我们当时选择是SAP、还是Oracle工厂软件?
当时我问顾问公司:SAP与Oracle有什么不同?他讲,SAP比较反人性,比较死,什么都不能改,好处是所有人不要指望从这边任何一个流程绕过去;Oracle,有比较好灵活定制的能力。
我做互联网出身,肯定觉得Oracle好。当时又问了一句:如果从汽车行业最佳实践看,是什么样?他说,至少在中国,大部分用Oracle,最后都切回SAP。
我当时就明白,这些软件能力,与我们互联网公司构建的软件能力不一样,最主要目的是控制。
包含银行上IT系统,包括制造体系、销售体系上软件系统,都是为了控制。
今天跑在软件里,汽车上万个零部件可以标准化生产出来,甚至汽车跑在路上的质量比手机还要好,是BT与IT发挥巨大作用。
第三阶段非常有意思,这个时代描述最好的是,从IT时代进入到DT时代,DT指Data Technology数据技术。
我们做互联网,做汽车之家,所有网站服务用户的软件是自己写的,所有面向客户的软件是自己写的,包括所有数据分析、流量分析的软件都是自己写的。
这是中国成规模的互联网公司必须要有的能力,每个月要服务上亿访问者。
第一、它必须是面向一个客户提供闭环服务。传统公司喜欢叫端到端,互联网公司叫闭环。
包括他从进入一个店,到把这个车买走,这是一个端到端。
第二、我要获得原子级数据,而不是控制点的数据。它能反映出所有起因、过程、结果,反映任何一个客户在这里发生业务的全貌。
第三、如果是面向一个用户,它是一个端到端或闭环,大概率会跨业务,甚至跨公司。
第三个重要点是,要把财务放进去,获取用户过程是成本,变现过程是收入。只有把财务放进去,才能避免每个专业只看自己一亩三分地。他有看全貌能力,就有使用整体数据的能力。
第一个结果是,我们最开始做理想汽车,很多人跟我们推荐一些老专家。
我们当时把专家招进来,我还是互联网思维说:你能不能把你知道的know how写出来,发现他写不出来。
这个模型在他脑子里,他写不出来,只有遇到问题,帮你诊断才能解决问题,当时不知道怎么使用老专家。
当我们有了DT以后,当我们写大型软件能获得完整数据,意味着什么?
只要是高成功率、低成本完成一个业务,它是个最佳实践,是藏在老专家脑子里。
哪怕我们遇到问题,这个问题怎么被有效解决,也是最佳实践,这些经验、知识,从老专家脑子里变到我们系统里,这是巨大收益。
这给我们带来非常大一个好处。我们常州第二个厂房,产能不够时,生产L7、L8这2个产品。我们这个工厂,从开始生产到产能爬满,只用了15天。我们团队有来自传统汽车厂商的人,他们说如果在原来企业,需要6~12个月,相当于我们可以把最佳实践有效复制。
开一家店很难,很多店,从0开始,要养很长时间。我们店里人员是集中来北京或常州培训,我们只要一个店选址没问题,它从开始营业到最后达到1个月超过100辆,大概是3~6个月。会比正常一家新店启动速度快得多,甚至比你找加盟速度还要快。
就跟我们原来做汽车之家一样,虽说我们了解用户,了解用户,不是跟用户聊,而是认真看用户访问行为,他为什么走,为什么来?
他从不同渠道来了以后,是什么轨迹?他最后出现问题走时,那是真因,我们怎么让他顺畅浏览下去?
比如他看一个帖子页面,10张图片就翻一页,翻着翻着没意思就走了,翻着太累。当我们把1个页面变成50张图1页,他就非常有耐心一直往下看。
我们用这种方式,一方面驱动我们怎么获取用户,让用户停留时间更长,让用户一直留存下来;另一方面驱动我们收入,甚至包括收入怎么定价,都是拿数据决定。
汽车之家,我们涨价,广告客户会抱怨,也没什么可说的。我们完全能通过数据评估,他一个店,我们到底给他带来多少收入、多少利润。
它比较像什么强化学习RL,Reinforcement Learning,它是给每个使用者一个有效反馈机制。
看我们销售团队,他们是1个月卖20~30辆车的王牌销售,还是卖10辆、卖几辆的?
影响因素排在最靠前的,是他对信息、数据、工具的使用,而不是她是不是美女,或者是内向、还是外向。
第三是最重要的一点,数据里的最佳实践,是AI后训练的全部。
很多基座模型,在解决一些通用能力很好,进入专业时发现,完全没有能力。这些数据不可能放在互联网公开,都是企业独有,是头部企业才懂得怎么获得。
本身你得是卖智能车最好的企业,才能做自动驾驶的训练,否则你过去连传感器都没有,这些数据都没获得。
同样,用户这些驾驶数据,我们肯定也按模型看。驾驶效率最高的,与安全性最高的进行权重,这3%的人,他们clips数据样本怎么放入模型里训练,就形成了端到端模型。
张小珺:
听起来,预训练Scaling Law规模效应到达瓶颈,进入后训练Scaling
Law,对你们是好事?
张小珺:
你没有回答我刚才问题,你觉得李想是实用主义的人吗?李想有理想吗?
李想:
实现硅基家人那一刻,我真的相信,无比坚定,就连我都可以被它去延续,这算不算有理想?
李想:
任何技术一定要赋予一个意义,增程是技术,城市用电、长途发电,是它的意义,这是根本。
张小珺:
我们聊聊你们另一个产品智能驾驶,你现在开车百分之多少,会用辅助驾驶?
李想:
我自己目标是3年,3年时间,我们能推出把方向盘摘掉的产品。
张小珺:
什么时候,能看到理想第一个为自动驾驶L4定义的车?现在已经在定义了吗?
李想:
给我3年时间,它需要技术与产品到位,需要环境与政策到位,需要消费者对AI信任到位。
张小珺:
你既然说AI这么重要,在你创业之初,就已经决定要做,为什么你们开始智驾是同行里最晚的?
李想:
我是连续创业者,最大好处是知道企业发展节奏。
当你有了收入,从1到10要做什么,这是我跟新进入创业者一个根本性不同。
理想汽车早期融资能力最差,融的钱最少。那么多钱情况下,第一个步骤是想着如何把产品做好。我们获得市场认可,有了自己收入,也包含2020年与2021年分别在美国与中国香港IPO,有了更多资金。
2020年初开始,我们开始做技术平台化。类似智能驾驶平台,大家看到的AD Max、AD Pro,座舱平台SS,也开始做整车域控制器XCU,我们在研发有了很大进步。
过去传统供应商我们不再需要,我们自己成为这几个关键零部件、车内控制器的一级供应商。再往后,也包含我们做模型,做电机的碳化硅。
它是一个创业公司往上成长,在你资源有限与资源增长以后,分别投资什么的演进。
张小珺:
听说你们之前被供应商欺负的很惨,他们铁了心觉得你们做不出来。
李想:
我们经常发出一个邮件,尤其疫情期间,2周以后才有人回复。我们没办法,决定要自己做自动驾驶所有研发,从域控制器开始做。
张小珺:
自动驾驶上,你们做了2个相对激进的决策:第一、是用只有一个模型的端到端,其他中国车企可能还在用2个模型;第二、你们是第一个取消角毫米波雷达的中国车企,走了以纯视觉为主的技术路线。这2个决策当时是怎么做的,是你拍的板吗?
李想:
我经常跟团队说,我们相比特斯拉不缺胳膊少腿,为什么它能做的,你做不到?
我们为什么保留前面毫米波雷达、前面激光雷达?毫米波雷达与激光雷达与做端到端关系不大,端到端是纯视觉。包含我们交互,大家再看到我们下个大版本更新,可以看到端到端、VLM视觉语言模型怎么工作。
很多人不太理解,你为什么要保留激光雷达,是不是你技术不好?
不是,中国与美国不一样。如果你经常在中国夜路开车,你会看到,有尾灯坏了的大货车,甚至大货车直接停在主路,也有不标准的半夜道路施工。一个前面的激光雷达,是为了安全。
我们使用端到端,包括通过Transformer做BEV架构,至少今天摄像头在深夜没有光线下看到的距离只有100米出头,激光雷达在任何没有光线情况下可以看到200米,这就帮助我们实现130公里时速的AEB自动紧急制动系统。
我们是面向家庭的车,每个人生命安全非常重要。这是我们继续保留激光雷达根本原因所在,后面车型会持续保留,激光雷达相当于安全带,帮车主解决重大事故。
我相信如果马斯克在中国,在深夜,在不同高速开过车,他也会选择把前面一颗激光雷达保留下来。特斯拉对安全同样重视,只是他要在这个环境看到。
激光雷达与视觉的配合,安全上有2个作用:一方面,最容易出的事故是钻到大车底下,产生追尾。尤其光线不好,甚至没有光线情况下,如果可以做到,能减少90%以上重大伤亡事故。
甚至我们研发AES自动紧急避让,哪怕他超速,刹不住,我怎么躲避?包括AES的两段式,是第一次躲避以后,遇到问题,怎么做第二次躲避,都是为了让车辆变得足够安全。
我们想办法消除90%以上,甚至最终目标是消除所有重大伤亡事故。
另一方面,是对其他交通参与者的安全。他可能踩的是滑板车,骑的是单板车,也可能喝醉了坐在路上,更好的传感器对安全有巨大帮助。
张小珺:
刚才说到那2个,你相对激进的决定,为什么其他中国车企没有马上这么做?
李想:
可能跟我们有一些比较好的外脑有关,像王兴、陆奇博士,给我们带来很多启发。
比如,用规则算法,用解决corner
case极端情况的方法,能不能解决自动驾驶?解决不了。
我说服理想汽车智能驾驶研发副总裁郎咸朋很重要的一点:你们经常解决1个corner case,又出现3个corner case,你是基于这个场景解决这个corner case,场景一变化,又出现新的corner case,你们一辈子都在解决corner case,解决不完。
一次战略会,陆奇博士给我们讲,你们应该思考一下人是怎么工作的,这对我们帮助很大。
我说服郎博,是拿我爱人举例。我爱人也是正常驾校学开车,拿到驾本。她最开始开车经常刮蹭,我给她买了一辆宝马X6,她开起来刮蹭,觉得车是不是太大,X6接近5米长。我又给她换了4米2、4米3的高尔夫GTI,还是刮蹭。你坐在车里说,你不要刮蹭、不要刮蹭,还是会蹭。她会蹭别的车,进小区会蹭门。
怎么解决?当时,我想了一个特别有意思的方式,我家有X6、X5M,我就说,你应该学一学宝马驾驶培训学校,学初级班就可以,一天时间。
宝马驾驶学校的初级班是什么,很重要的是解决你的能力问题,不是解决corner case。
一天下来只学两件事:你开车应该看哪里,教你怎么踩刹车。
我老婆后面基本跟刮蹭告别,开车开得非常之好。她只学了一天,学的是能力。
端到端最后体现出来的是能力,而不是去解决功能、解决corner case。
张小珺:
在你看来,端到端是自动驾驶的终极手段吗?
端到端+VLM可以解决L3,比如实现500公里~1,000公里一次接管,让你在车上相对轻松。但它想实现L4,泛化能力远远不够。
张小珺:
你们会像马斯克一样做Robotaxi吗?
李想:
我不想做,我们使命是创造移动的家,创造幸福的家。
张小珺:
会不会Robotaxi到来以后,就没人开车了?
李想:
今天租房比买房便宜得多。你拿出存款利息,就可以租到很好的房子,钱都在你手里,但我们仍然买房。
我们为什么要买房、要构建家,我们需要高质量陪伴。我们需要为家人创造稳定、安全、舒适的环境。
车也这样,实现L4自动驾驶,家庭用车更便宜、成本更低。我相信,愿意拥有一辆车的人会更多。
可能5年、10年后,大家重新看,到底Robotaxi是未来主流,还是更多人拥有一辆自动驾驶的车,它使用率很高,能为家人、朋友享用?可能未来几年是分水岭。
我相信,当一个空间变得更好、效率更高、体验更好,我更应该拥有这个空间。
张小珺:
你怎么看特斯拉与Waymo路线之争?做L4的派系,如Waymo会说,你们L2辅助驾驶做得越好,就离L4自动驾驶越远。
李想:
L2等于规则算法,也有拿规则算法直接做L4的,但在限定场景。
很多过去做L4的公司,也一定在做端到端,在端到端上再做一些迭代与创新。
我相信真正具备广泛性、通用性、而不是特定区域的L4,一定是VLA。
所有想通往L4的企业可能都是VLA,或者比VLA更好的方式。
大家不会拒绝这件事,就跟大家今天都用Transformer,都用大语言模型一样。
李想:特斯拉与我们比较好的一点是,没有达到L4之前,只要能力提升,就会带来卖车的商业优势。
比如我的MPI接管率,从50公里到500公里,如果别人只有200公里,我的车就会好卖很多;不是非得到L4那一刻,才产生商业模式。
AI
领域,经济反馈模型对汽车企业比较友好。汽车本身在内卷,这个反馈方式挺友好,你能力的提升,会直接带来变现与竞争力。
Waymo
做得很好,在努力商业化,在旧金山打车占比越来越高。都是一帮足够聪明的人,不用为他们担心。
张小珺:
很多人在问,理想会做机器人吗,特别是人形机器人,既然你要创造硅基家人。
我们如果连L4级别自动驾驶汽车,都解决不了,怎么去解决更复杂的?
车是无接触机器人,包括道路提示、参与者都是标准化的,每个人都受交通规则训练,这已经是最简单的AI机器人。如果车没法实现,其他AI机器人非常有限。
李想:
如果世界上有做得好的,我们会合作。如果没有,会自己做。
理想同学,可不可以在手机上使用?可以啊,手机厂商做得非常好,不需要我再去做手机。
理想同学,可不可以接电脑?那也很好,整个浏览器模式是标准化的,你可以把理想同学做成浏览器插件,让浏览器体验变得更好,都是公开的。
你可以在Chrome上做,可以在Safari上做。
核心是,如果我们看到一个特别重要的事,没有人解决这个硬件,我们就必须得去做,好的硬件是软件的必要条件。
张小珺:
你说你从来不认为电动车是创业终点,现在电动车这场仗还没打赢。
李想:
我觉得分2个阶段,第一阶段是看到一些更表面或者眼前能解决的问题;后面,我们看到的是当时一些选择带来不可改变的东西。
L9发挥了这样作用,既能抢轿车,又能抢MPV,还能抢SUV。
我们抢了很多豪华MPV用户,普遍都是长期MPV使用者买Mega,非常满意。
并没有从太多其他轿车、SUV人群,抢到属于Mega的用户。
他们自己开的时,更愿意开SUV与轿车,这个尺寸停车更方便,倒不是造型。
这意味着我们只能在50万MPV里抢市场。50万以上MPV,1个月4,000辆,我们今天做到1,000辆,25%市场份额,可能还会再大。哪怕我们吃掉50%,也是1个月2,000辆市场份额。
第二个问题,是我们对纯电理解还是不够,尤其对充电桩怎么建。
我们开始认为,只要在高速建充电桩就可以,不需要在城市建。
我们忽视一个问题,车主交际圈,比如他在二线城市居住,他去一线城市交际,除了路上要充电,这些城市也要能充到电。
他的时间很值钱,他不愿意跟网约车司机挤在那里,等1个多小时充电,我们充电桩建的数量远远不够。
充电桩流程体验非常差,早期,Mega关于充电站的NPS净推荐值只有30多分。我们一直优化,开足够多站点,优化每个细节,包括站位,包括软件做得顺畅。
我认识非常多北京Mega车主,家里有多辆车,过去去阿那亚、北京周边开燃油车,今天他们开Mega。
也因为我们对充电的理解与充电体系的建设,包括充电从APP上如何给大家构建安全感,也包括我们除了自建,还把大量、高质量充电桩认证以后加入这个体系,用户只需要花积分就可以使用。作为高端纯电车体验,我们应该是非常领先了。
如果再往外站出来看,很重要的是,我们经历了一个重要阶段。
我最开始创办这家公司,招的最多的人,是创造好产品,以这样的人为主。
包括理想汽车产品线总裁刘杰、理想汽车产品部高级副总裁范皓宇,这些最优秀管理人才是这么锻炼出来的。我们做了理想ONE,并把L系列做得非常成功,L9各方面都是天花板。
L9在2022年9月出来,这些天花板是我们从2019年就开始构建平台化能力,从2020年开始坚定投资,这么多年把这些东西做出来,才出来L9这样产品。
包括从全世界招募设计团队,最开始设计团队都是中国人,后来有了理想汽车高级设计总监Benjamin Baum这些顶级设计师加入,把能力提升。
L9
出来是一个震撼世界的产品,L8、L7、L6享受到这个好处。
相当于,我们有收入开始从2020年,大概用了3年多,就做到1年超过1,000亿收入。
L9出来,我们遇到一个很大问题:运营能力完全跟不上。当时运营能力,还是我当年做汽车之家那几十亿、接近100亿规模的运营能力,没有大几百亿、甚至上千亿的运营能力。
我举例,我们招了很多大公司同事来了以后,他们说这件事怎么做?有没有什么流程?我应该怎么入手?这些人后来都变成我们流程建设者。
但他给我讲,咱们公司原来在管这些业务运营时怎么管?是要想到达那个地方怎么走?瞄准方式是:你记住,前面第4棵树左转,遇到一个井盖右转。
他讲完,我就知道了,我们要想把运营体系支撑一个千亿规模,我要建立体系。
我们很多同事在千亿收入公司工作过,但没有建立过这个体系,没有修过路。
我得先把路修好,车才能跑顺,而不能靠大家背井盖、背树,那这个公司没法运作。
最好的方式是什么?让过去这些做产品、做业务最优秀的人来主导变革,去修研发领域的路,修销售领域的路,修管理领域的路。
这段时间,我们把最重要的人才,范皓宇、刘杰都调去提升运营能力。
我们产品创造领域缺少一些大将军,虽然后来长出来一些将军,但当时那些将军是最强的一帮将军。
李想:
对我一个很大挑战是,我在开L9产品定义会、产品评审会的时,我身边是刘杰、范皓宇、理想汽车第一产品线总裁汤靖,是公司的VP。
我们做Mega遇到一个问题,我开评审会时,是总监,是高级经理。他们没有经历过为什么成功的阶段,少数人经历过,多数人没有经历过。
现阶段,我们用了2年,把千亿体系能力构建起来。我们回头看,这个课是必须得补。
像皓宇、郎博、刘杰这样,他慢慢具备2个能力,一是,怎么构建产品、创造价值的能力,把屋顶拉得越来越高;二是,他知道怎么运营好的能力。
按任正非讲的是,这些合格的管理者,要具备2个能力:一个是建黑土地的能力,一个是打粮食的能力,或者他知道怎么跟别人协作这个能力,这是我们过去用2年所做的重要变化。
补这个能力不后悔,但多少它对现阶段产品能力,有一定耽误。Mega不是所有方面都是天花板,但L9是。
重要挑战是,当我们出SUV系列,我们推出的产品是不是这个价位、这个级别方方面面的天花板?这是很公平的,对所有企业是一样的挑战。
我们意识到这个问题,我又重新把刘杰、皓宇、汤靖这些做产品能力最强的人,角色进行调整,重新成立产品线,让这些人主导产品。
让这些可以跟李想一吵架,能吵1个月、2个月,跟我吵得特别开心笑,结果特别好的这帮人,来真正变成大将军,主导我们后面产品。
张小珺:
他们跟你为什么吵架?为什么会吵1个月、2个月?
汤靖、理想汽车第二产品线总裁张骁,理想汽车第三产品线总裁李昕旸,从历史而言,吵架总是能赢我。
李想:
比如针对L7、L8,是否应该用一个车型做五座版与六座版,我们在过去几个月就吵过。
我认为用一个车型提供五座版、六座版就可以,把上下车做好。做出来以后,不是我们满意的,还得2个车型,上下车也不是最好的,造型不是最好的。我们不想做任何一个错误的产品,又分成2个。
我当时坚持要做一个,最后我妥协了,做2个。我妥协是他们真的对,验证出来体验不一样,我们不能做凑活的产品。
张小珺:
一般大家普遍畏惧沟通、畏惧冲突,作为CEO是喜欢高管与自己吵架?
特别像乔布斯讲的那个故事,他认识一个邻居,一个大爷拿着一堆普通石头放到一个机器里,几天以后拿出来,都是漂亮的球。
真正顶级团队在做产品,做研究,做创造时,就应该是这样,我喜欢看到大家在吵架。
李想:没什么绝招。在这个价位,用户最在意的一些价值,你是不是天花板?就这么件事。
它是综合之战,你的技术到产品,产品到商业的一个完整作战体系。
张小珺:
电动车这场仗,什么时候能分出胜负手?现在中国汽车非常内卷。
李想:
电动化与智能化是两场仗,电动化相当于没有资源企业的一张门票。
三星到了智能手机,还是拿到了门票。它是传统手机厂商,之前也跟诺基亚时代竞争,它一直手里拿着这张门票。它的手机,经历从传统功能机、到触屏机、再到智能机的阶段。
也有别的领域非常强的人,到进入那一刻竞争时,他有门票。只是它的门票,不是硬件本身,是已经掌握另外一个能力的门票。比如它有操作系统的能力,有大型软件的能力,苹果它就可以过来拿这张门票,谷歌可以过来拿这张进入决赛的门票。
电动车本身,L4会分出来真正胜负。我们今天在做的所有事,是为了L4拿门票,L4所需要花的资金、所需要拥有的能力、所需要的数据量,是今天不具备的,今天大家要靠这个东西拿L4的门票。
第三、要足够多的资金,招募最顶级的人才,拥有足够算力。
张小珺:
当都满足了这些条件,做到足够卓越,能做出一家类似苹果这样的公司吗?
汽车企业发展多年,跟传统汽车厂的竞争结束,又有很多外来者。
我读苹果流传出来的内容,当时曾任苹果首席设计师、资深副总裁乔纳森Jony Ive说了很重要的一点:苹果没必要设计一个带方向盘的车。
这是我印象最深的一句话,如果没有方向盘,苹果会不会进入这一项领域?
最开始大家看到,新势力、特斯拉,跟传统汽车的竞争。后来华为进来,再后来小米又进来。大家发现这个竞争又发生新的变化,这是世界的精彩与丰富之处。
第一个挑战,是如果做汽车,苹果组织模式必须发生变化。
汽车比手机更复杂,这是真实存在的。苹果过去公司治理模式,太完美了。这时要产生变化,如果没有特别明确、清晰的愿景,或者强大吸引力,很难说服苹果内部的人改变现在组织与工作方式。
苹果决定放弃造车时,特斯拉几千亿美元市值,苹果是2万亿美元。
组织内会说,我们2万亿美元市值的公司,为什么要学一个几千亿的,甚至它的估值是被高估的,它享受高PE。这对最成功、成功到完美的公司,是巨大挑战。
如果你做到了大模型阶段,它变成Token,跟隐私什么关系都没有。相反,它是解决隐私最好的方式。
这些厉害的企业,都是一帮足够聪明的人。当他看明白,当他拥抱AI,可能比大家想象的进步速度快得多。
李想:
雷军做硬件能力非常强,没什么可质疑。他不只是做车做好了,电视机、空调做得也非常好,各个东西做得都非常好。
我们作为一个家庭用户,不会在意的东西,在小米SU7做出来,又会吸引非常大的人群去喜欢功能,比如2秒多的加速。
他经常会找我聊一下,有时电话,有时让我去他们公司,一聊时间很长。
他经常跟我聊,我对特斯拉看法、对比亚迪看法、对华为看法,我会如实跟他讲。
有一次他聊完,他说我对这3家看法,跟他是比较接近的。
他最后问了个问题:如果我们做汽车,你给我一个建议,只要一个,是什么?
我说:小米车要想成功,你必须All
in,没有什么其他的,只要做到这一点,小米汽车就会成功。
我们跟小米关系不错,Mega遇到问题,他们团队还来帮我们。
我们对恶性公关没有经验,小米常年遇到这样问题,都在帮我们。
包括我们Mega后面,L6很艰难,雷军来帮我们站台。
张小珺:
你为什么买法拉利?它又不AI,又不自动驾驶。
李想:
体验对我来说很重要,体验就像我做预训练的一部分。
大家今天看到L9是面向家庭最好的5座产品,很重要是我长期是宝马X7、奔驰GLX、特斯拉Model X的用户,这些体验不可替代。
买法拉利一个重要原因是,身边很多朋友,包含股东,对理想汽车提出下一阶段挑战:品牌如何做升级?
这包含汽车行业做得最好的品牌,我最喜欢的,一个是宝马,一个是法拉利。
法拉利我还没体验过,只有通过体验,才能变成我的认知与能力。
李想:
不冲突。做好功能与体验,做好能力与训练,更好的品牌,给用户提供更高陪伴与情绪价值,都不冲突。
李想:
如果我没买法拉利之前,我会说永远不会上法拉利。
那一刻,各种各样方盒子出现,里面有非常好的空间,谁来满足乐趣?
如果能有一辆想自动驾驶就自动驾驶、想自己开就自己开,但又非常好的AI的车,为什么不可以?科幻电影里有这样的体现。
就跟穿鞋一样,穿运动鞋最舒服,为什么女生还要穿高跟鞋,是一定有它的价值存在。
我今天一个想法是,可能到2030年,我们甚至有50%概率会做一辆非常有趣的超级跑车,它一定是AI的。
张小珺:
在你看来,法拉利这样的车企,应该拥抱AI吗?
李想:
可能跟很多人想象的不一样,法拉利也可能因为乔纳森去当独立董事,法拉利对CarPlay的使用非常好,包括CarPlay里面的交互与连接关系,甚至比很多普通企业做得要好。
欧洲奢侈品品牌,最重要的还是延续稀有与设计,那个价值是它独有的。
哪怕到了下一个时代,还是应该变成一个更好的法拉利,而不是变成一个科技企业,只是科技企业里可能出现有意思的车型。
李想:
我是理想产品的天花板。从0到1,产品是我来主导。
我带有2个原因:一个原因是我对X7、GLS、Model X,对3排座椅的车,有非常深的体验。中国可能没有任何一个CEO,比我对3排座椅的车,体验得更全面、深刻。
我从来没有司机,哪怕去机场,都是我自己开着车去,司机再把车开回来。
体验的能力、范围、深度,是你做产品的预训练,是你的基座模型。
没有这些,后面都是白搭,东拼西凑一些东西凑不上去。
今天汤靖也是,他有L9,有Mega,对这些体验非常深,也长时间开问界M9,这就对了。
李昕旸也一样,他还有别的牌子电动车,做深度体验,任何一个新品出来以后,要开很长时间,这就对了。
只要他有这些体验,就能做出好的产品,按照我们这套方法论体系。
我怎么把这个东西变成一个能力,让他们拥有?怎么建立培养他们的体系?
我是一个从来没工作的人出来创业,我行,他们一定行,他们受的教育比我更好。
张小珺:
怎么选拔产品的大将军?怎么样是一个好的产品经理?
李想:第一、是他的向外感知、向外体验、跨领域的感知能力特别强。
我们增程的想法,并不来自雪佛兰Volt,来自苹果MAC的Fusion Drive。
我们当时就发现苹果在解决这个问题,用Fusion
Drive解决。SSD硬盘太贵,速度很快;HD硬盘很慢,容量很大。它就让程序跑在SSD上,把存储放在HD上,SSD能存基础的所有东西。
我们做的增程结构,跟之前增程完全不一样,甚至可以讲重新发明了增程。
雪佛兰Volt只是为了做而做一个产品,没有想明白真正用户价值在哪,一定要跨领域感受、体验、获取知识。
第二、要特别敏感,不能随随便便凑合,不能无所谓,这个东西歪了就是歪了。
我坐L9第一次下车,它蹭腿了就是蹭腿了,你不要再解释什么奔驰蹭腿,宝马蹭腿。蹭腿是不对,就得改。
他要非常之敏感。Mega最开始那个版本,悬架是晃。他就讲别的MPV晃,我说不能,我们要解决问题,我们不能晃。
今天大家觉得Mega几乎是电动车悬挂天花板,那是我们特别敏感、苛刻,不放过任何一个影响到我们体验的细节。
这些人敏感,我觉得不是坏事,哪怕这些人带些情绪,都是好事。
怎么体验,怎么验证,怎么定义,怎么验证定义,定义出现问题、又怎么修正,他一定要走这个体系,不能拍脑袋。
他很敏感,但他的敏感只是启发,仍然要走产品专业体系。
这三个组合了,这个人自然就训练出来。这三个条件挺反差,产品的人最难培养,上学也没有这个专业。
张小珺:
今天距离你当时录产品实战课时,产品经验有迭代吗?
大家今天得有一个新的理解:它是能力,能力是不一样了,包含整个工作方式也不一样。当我们做AI,研发方式会发生根本性变化。
它相当于把人类知识,任何形式表达的知识,汇集在一起,相当于我读了好多专业,拿了好多学位,后边变成MoE以后,更类似这样一个状况。
它要有非常强的BT、IT、DT能力,才能用AI的能力。
他得了解业务,才能知道怎么做好数据收集,后面的训练,什么是高质量数据。
这类角色,包含原来写代码的,企业产品经理,还有业务专家,如何通过自己学习变成AI教练。
如果我们想把AI产品做得更好,我们进入做自动驾驶的最好核心,是驾驶DT的数据;如果是我们想做To C产品,最重要的是人类对话记忆DT的数据,这本身也是AI教练必须要做好的一部分。
这是我们看到的全新三大工种,今天各种专业的人,要往这三个工种找自己未来之路。
张小珺:
你现在怎么学习AI?你不是技术型创业者,学AI,对你来说难吗?
李想:第一、学AI一个重要方式,是我们有研究团队。
我每周会参加4~5次AI的会,会讲两方面内容:一是最新论文,二是不同团队关于AI的最佳实践,哪怕一个很小的亮点都可以分享,它会对其他团队有相互启发。
我自己读论文能力很差,通过有效讲解与分析,我对各领域AI前沿论文,会有了解。
这些东西,你一定要使用。使用过程中,会有自己真正感受与感悟。
第三、特别重要,包括为什么一定请你来当主持人,我特别喜欢看今天的对话。
包含Sam Altman、黄仁勋观点,都是通过对话方式看到。
一个人如果单独演讲,有什么问题?他表达的内容包含why、what、how,他讲的每句话有自己认知,但听的人很难收到。
尤其他想表达全新、复杂的东西,对话方式特别好,提问者在提问时已经结构化,并把意图明确,甚至把意义明确。对话过程中,其他聆听者接收效率会特别高。
张小珺:
听起来你要做的事情好多,又是理想同学,又是大模型Mind GPT,又是智能驾驶,又是车,时间怎么分配?
李想:我们已经是千亿收入规模企业里,做减法做得最厉害的。车型很克制,车型的平台化程度非常高。
我要确保,在AI方面,我们给自己与团队出的题是对的,做这些题的人与组织是对的。
第三是为这2个提供足够资源,是计算,资源是相对理性的资源,也不是拍脑袋,资源是足够能实现我们目标。
李想:郎博是自己出的题,他们更早会用到BLM这套工具Business Leading Model。他们给自己出的题是:大概2025年实现500公里一次接管,把MPI提升到500公里,比今天大概提升10倍。
张小珺:如果资源有限,理想同学与智能驾驶必须二选一,你放弃哪个?
张小珺:我看了你的日程,这周不算我们访谈,一共只有9个会,这里面,2个会2小时,3个会1小时,3个会不到1小时,你没有早会要开、晚上不安排日程,这对一个管理着3万人的CEO,相当清闲。
无论招聘、培训,还是一些组织与人力资源的制度,都是我的优先级。
甚至广州车展,跟我们重要的员工文化培训冲突,我选择不去广州车展,做员工文化培训。
任何18级及18级以上,还包含少部分17级员工,我都会面试。
很长时间,在产品层面,我还能给团队贡献很多价值,包括让他们怎么构建产品体系,包括把这一拨人带着把产品能力变得更高。
我们资本团队与技术团队,会大量帮我们邀请各行业最优秀的人沟通与交流。
张小珺:
你描述的是时间分配,你能纵向跟我讲讲你的一天吗?你是家与公司两点一线吗?
中午左右,是人相关的工作,包含校招团队培训沟通什么的,都会放中午、下午。
大家会这么来排序,这么着,大家时间比较好凑在一起。
我们最重要决策,放在周六。战略委员会的团队,都是周六工作。
周六,做任何决策时间可以很长,他也不用担心别的工作,大部分员工不上班。
我们不用受别的工作影响,不用受客户、合作伙伴影响。
李想:
好在我们这帮人承受力很强,大家该爆粗口、爆粗口,都会有。
张小珺:
如果作为一家AI公司CEO,你的优势与劣势是什么?
小时我在老家长大,上小学回石家庄,上初中开始接触电脑,自己家里没有电脑。
我通过把所有零花钱,买各种各样电脑杂志与书籍学习电脑。
初中,我面对的所有东西都是质疑,父母担心我学习不好,是不是可以考虑上一些职业学校,有一个稳定工作与饭碗。
李想:
如果按分位,大概属于70~80分位,中等偏好。
中等偏好,在班里一般不太受欢迎,老师要么关注学习好的,要么关注学习不好的。
那个时代,很多人不知道什么是电脑,只觉得电脑是游戏机,是坏东西。
也会反对说:你这么学是不对的,你这个孩子天天研究,是不是有自闭症?那是我的初中时代。
初中升高中,我拥有电脑。有了电脑,我还印象特别深,我跟班里电脑水平最高的同学聊,他跟我说:我有电脑时,你还没见过电脑,你没资格跟我聊。
后边发展就完全不一样了,我1个月电脑水平就超过他。
我过去3年获取的信息,到真正去实践,提供巨大帮助。
我就找到一个有效模式,几年前,很多人说理想汽车核心驱动力是什么?我觉得是成长。
但成长是完整模式,是通过学习,再验证,最后形成成长。
我在高中就有效找到一个方式,我的成长速度比身边同学快。
第一、我在解决什么问题时,会广泛阅读各种各样信息,尤其有了互联网,非常有帮助。
甚至在没有互联网之前,我还用Telnet获取大量信息。如果我是AI,非常像我的预训练。包括跟各种各样人聊,让我对这个领域有了解。
当问题解决以后,我会复盘,把它变成自己能力,是成长。
我自己经历模式,是学习、验证、成长的过程。非常像AI中预训练、后训练,包括强化学习这一套体系。
张小珺:
你想做AI,是觉得跟它有亲切感,是吗,并不是你相信这个技术本身?
李想:
我的一个最大感觉是,尤其当大模型出现,人类会发生根本性改变,会变得更好。
互联网实现信息平权,AI开始帮助大家实现知识、认知、能力平权。
张小珺:
你是一个敏感的人,这对做产品很好,对做一个CEO呢?
CEO有不同类型,我们一直在讨论,人的性格、特质,甚至原生家庭,跟他创业有没有直接关联?我跟很多顶级投资人聊,他们都讲投的是人,判断人非常难。
我问过一个顶级投资人,你投资所有成功案例,这些人具备什么共性?
这是非常有意思的话题,他当时想了想,说:我们不知道怎么有一套方法选到准的人,共性是有的。
共性是,这个人无论你觉得他气场特别大,还是气场特别小;是善于表达,还是不善于表达的人,每当最艰难与最关键的时刻,他总能看透本质,做出选择。
跟他的背景、学历、经历没关系,是他具备这个特质,这个特质可以延续,他会多次做出这样的选择。
最重要的是,每当关键时刻,每当在一个最艰难的十字路口,这个创始人能不能看透本质、做出对团队最好选择,通过未来可以验证,这是最重要的能力。
张小珺:
回顾过去10年,2019年是你最困难的时刻吗?
我最困难的是2008年5月,几个小股东要把我与汽车之家联合创始人、副总裁樊铮赶出公司。
融钱融不到,现金流断掉,股东也在挑战我们,甚至认为我们不适合,应该离开公司。
那是我至今最困难的一次,那是真的会自己伤心到会哭的那个程度,很多事,你自己想着想着情绪就会掉眼泪,后边没有我自己会伤心到会哭的。
那也是我至今成长最大的一次,要把我们赶出公司的引领人是邵震,他是三个合伙人之一,把我们引入北京,并把商业体系构建起来。
我们当时来北京,在林业大学租了40平米房子,一室一厅,白天在工作,晚上甚至在一张床上睡觉。
这么着,大概有1年多,才搬到中关村租的写字楼。他的贡献是巨大的,当时出现这么一个问题。
后来我们和解了,和解的重要原因,他帮我获得最大一次成长。
他说:最难受的一点是,当公司融资困难,你一个人在死扛,你不告诉我们。
你每天工作十几个小时,把钱都拿出来,但你自己在死扛,我们帮不上忙。
他说:如果你当时把这些困难跟大家说出来,现金流遇到问题说出来,我们愿意把房子抵押来支持公司,我们每个人都愿意。
你并不给我们机会,你选择自己死扛,公司变得越来越差,他说时,你从他眼睛里看到绝对说的是真话。
我们曾经挣到钱,他们买的都是宝马5系,我开Polo;他们在北京买一两百万房子,我买几十万房子;我一天最少工作14小时,甚至16小时,从来不休假。
我从小受到的教育是,你要对自己特别严格,甚至苛刻,你不需要对自己好。
这至少是80年代,那帮人训练的一个体系,尤其你想很自立。
我选择创业很难,再去找一份工作,你学历什么都不行,对自己很苛刻。
第一要对自己好,要接受自己的优点,也能接纳自己的不足,很多不足是优点造成的。
比如我有点懒,往往懒的人,能做出特别好的产品,懒的人更能做出好的决策。
如果我很勤奋,运营就会变得非常好,但我运营能力很差,我从不碰运营的工作,我知道自己这方面不行,我要找到最好的人跟我配合。
就像刚才我说的问题,已经严重影响到身边的人,也影响到自己,我要变得对自己好。
我当时一个说法是,如果从来没吃过糖,我怎么给别人甜头,这是我很重要的一个改变。
这个问题解决后,我当时给自己很大方买了宝马X6,我从来没买过贵的车。
汽车之家上市,我还给自己买了辆迈凯伦MP4-12C,一个超跑;我也去买了大一点房子。
包括当时同事说:你开POLO,你让我们开什么?我们开什么都不合适。
自那以后,我也会去休假。包括我跟原来女朋友的问题,大部分都来自于我无视人家。
2008年,我认识的女朋友,变成我今天老婆,家庭很幸福。
我们过程中融资都很难,我不是等到没钱,再去找经纬中国创始管理合伙人张颖说:张颖,我们没钱了。
李想:
还有十几个亿,汽车后边要量产,供应链投资也要投几十个亿,包括你要开店。
我们现金还够6个月,我就会找到张颖,我会跟他讲2个。
一个是如果我们今天不融资,到明年再融很难,资本市场不好,公司还得降低估值,甚至融不到钱。
今天融,明年4月,我们就可以在上海车展收真正的订单。
2018年10月发布时,很受用户欢迎,后边就会进入一个上升阶段。我会把这些困难跟张颖讲,张颖很快帮我们又融了19亿。
张小珺:
这个过程,没有媒体写的艰难是吗?我记得当时你生病了。
那时特斯拉也遇到问题,又遇到疫情,蔚来当时跌到很便宜的价格,融资是最难的,比上一次还难。
我们见了150多个投资人,我当时得病了,免疫力都不行,浑身过敏,连呼吸道都长。
当时找了字节跳动创始人张一鸣,美团创始人、CEO王兴,他们都投了。
后来,我遇到很多困难,我会跟团队讲,甚至把我看到、团队没看到的困难跟团队讲,大家一起解决。
2019年初,钱很困难,我跟团队讲,我们接下来如果按这个花钱速度,没办法做到车交付,大家要节省钱,都是自己主动砍。
这帮人是今天主力,包括范皓宇,刘杰,理想汽车总裁、总工程师马东辉,理想汽车CFO李铁。我们都是一起决定,比我最开始预期还要好,也形成凝聚力。
那一次对我是最痛苦,也是改变最大的,甚至让我后边人生更幸福。
张小珺:
看得出来你是一个喜欢研究人的CEO,最近对人性有多一层认知吗?
2024年,在人的方面,最大收获来自3,000多人校招团队。
2023年,开始的校招人才,规模与质量非常好,很多大厂不招校招,给了我们更多机会。
我说,正常我们把他招进来放在这,像普通员工一样用,肯定不行,我们能不能通过更深刻的方式构建认知?
除了1~2周培训,我们让大家到工厂工作,包含电机厂、制造厂、工厂,他才了解工业领域的AI做到什么程度。
他要去店面工作,看我们怎么服务客户,这些客户是不是我们讲的家庭客户,怎么决策买一辆车,再有两周这样的。
这方面投入比一般企业要高得多,我们配最好的管理者陪着去,这一波校招产出非常之好。
我一个很大感触是,大家老觉得什么年轻人有问题,我说这比我们那代人优秀10倍以上,最优秀的人来了。他们受最好的教育,心智很成熟,我发现对他们管理方式不一样,我们很意外打通一套新的管理方式。
我们在面对这些90年代末,00初校招生,我们使用的方式:
真的重视他们,发自内心的在意,听他们需求是第一重要的。
当你认真听他们,这些年纪轻轻的人,都有自己做解决方案的能力。
我们原来认为一个员工,要到16、17级,才能做完整项目解决方案,他们今天每个都具备,有自己完整想法,对AI的使用是与生俱来的。
我们前2天,一个研发团队技术展示会,AI相关产品有一半以上是校招团队做的,非常之惊讶。
我延伸出另一个重点,这是我们2024年,面向2025年一个更重要的机会。
我们这些80后、70后,包括一部分90后初期的,在一个新的时代,是否需要被在意?被认可?被支持?
我们读的中国很多书经常讲,你要对事、不对人,我读了《高效能人士的7个习惯》,读的所有美国最顶级著作,乔布斯最根本的变化都是:学会了先对人、再做事。
包含我2008年最根本改变,也是先对人,甚至是先对自己。
我们相信,无论是我们这家企业想变得更好,还是中国如果从发展中国家走向发达国家,对待人的模式,都要发生根本变化。
一个时代过去了,一个新的时代开始,一个新的时代会变得更好。
张小珺:
你的一个00后员工想问你,在当前不利的外部环境,特别是地缘环境下,怎么成为全球领先的AI企业?
今天哪怕我们做汽车不涉及AI,也没办法讲,我会成为全球领先的汽车企业,我得先在中国市场第一,在受美国限制以外的市场,下一步能不能做成第一?AI也一样。
我给团队提的要求是,到2025年目标,是在中国空间智能领域能不能第一?在大语言模型方面、它所提供的服务方面,能不能前三?
团队按照这方面制定目标、构建能力、确定组织与投资,是最重要的,节奏非常重要。
再往后,我们看到的机会是,如何把语言模型与空间合成更大的VLA模型,去解决到AGI第三个阶段Agent,到L4自动驾驶阶段,你所具备的能力?站在今天还要看,我们搞什么样的研究,匹配什么样组织,怎么提前准备一些投资?
张小珺:
理想汽车未来还会叫理想汽车吗,如果它要变成AI企业?
李想:理想是一家AI企业,我们要做的不是汽车智能化,而是AI汽车化,将推动AI普惠到每一个家庭。我们通过AI,将物理世界与数字世界进行融合,让有限的空间实现无限的延伸。
20
世纪90年代之前,最好的处理器都是日本企业推出的,后来美国获得胜利。
过去我们认为全世界最好的汽车,是德国人制造的,今天,中国企业与一家特斯拉提供了全世界最好的智能汽车。
AI
方面也一样,只要我们不放弃,所有人每天努力,把所有心思与精力用在改变这些能力上面,去投入,结果一定会变得非常的好。
张小珺:
如果理想没有成功的成为全球领先的AI企业,会是什么?
李想:一定是刚才讲的几个综合能力,我们有缺失,包含研究、技术研发、产品、商业能力,也包含我们自身造血能力,这是综合体现。它是一个非常大的仗,甚至美国人把AI形容成曼哈顿计划,这是非常大的挑战。
我会全力以赴确保我们,有能力实现全球领先的AI企业,做好每一个环节。
如果在我有生之年,我没办法实现,或者我们犯了巨大错误没法实现,我非常乐于看到有中国顶尖企业能够在AI方面做得非常的好,实现AI的第五个阶段。
理想AI Talk访谈实录02、理想汽车到底谁懂智驾
2024年10月23日,理想汽车宣布行业首创全新一代双系统智驾方案端到端+VLM全量推送;11月28日,理想车位到车位智能驾驶率先推送。
不到1个月的时间,2024理想AI Talk预告:高速城市全场景升级端到端+VLM,将于12月31日全量推送AD Max用户。
2024年,理想智能驾驶发生了什么变化?关键节点上为何总能领先一步?
张小珺:
听说李想对智驾发了很大的火,你怎么还能留在这?
郎咸朋:
当时想哥说了一句很狠的话,他说郎博下半年如果我还看不到变化,我们还是拿不到头部位置,你这个负责人可以不用干了。
郎咸朋:
我觉得大家就回归的是体验与用户价值,重新把大家思路聚拢。
我们是给用户做有更好体验、更安全、更便捷的产品,而不是做一大堆什么从指标上看起来挺好的产品。那次所有人心里边又重新回到从产品出发,做智能驾驶,这是我觉得印象最深的一点。
郎咸朋:
想哥发火之前,我们内部这个端到端的预研,已经在开展。
郎咸朋:
我第一次试到这个车,从中关村开到北京交通大学。开了几公里,我问旁边的贾鹏,这是规则,还是怎么做的?怎么我觉得开得这么好?
贾鹏说一句规则都没写,全都是系统按照我们给它的数据,自己训练出来的。
我们开车都知道,如果前面有个车刹停,它是要缓慢减速,甚至还再抬起一点刹车,有这样非常舒适的刹车过程。
这个过程,我们团队在规则阶段,写了很长时间代码,都没有达到完全拟人、解决所有场景的表现。
我第一次试驾端到端,它的纵向就已经比之前试过所有的都要好的状态,这才用了短短不到15天。
我觉得那时建立一个信心,端到端一定能做出来。一旦它做出来,一定会比现在所有智能驾驶软件都要好。
张小珺:
端到端是灵丹妙药,为什么2023年不上?特斯拉2023年就上了,你2023年在干嘛?
郎咸朋:
我们在等,等足够数据与算力,等到了,我们就能上。
端到端VLM大模型最终的本质,是用AI来做自动驾驶。AI三个要素:算法、数据、算力,这三个要素必须全都齐备。我们2024年准备好,所以我们能做这个事。
理想AD Max车型销量,2023年起来了之后,到2024年初,高质量训练数据量达到10亿公里左右规模,这是一个基础。
第二是算力基础,2024年初,我们算力到5EFLOPS。
再加上第三步,端到端一些预研也有一定成果,到2024年初,是天时地利人和,可以做这个事,2023年我们还在补课的过程。
张小珺:
为什么很多企业端到端是两个模型,不是One Model?
我们要做端到端时,给自己定了一个目标,一定要用纯数据驱动的方式来做这件事,不是结合之前规则来做,所以说它性能上限非常高。
张小珺:
为什么理想是端到端+VLM,不像特斯拉只用端到端?你们对自己端到端不够自信?
郎咸朋:
不能这么讲,我们在做技术方案时,充分参考世界上所有先进方案,始终无法解决一个问题是,当一套自动驾驶或智能驾驶系统,它工作时,如果遇到之前没有见过的场景,应该怎么处理?我们认为是端到端+VLM,就是系统1+系统2,很好模仿人类大脑工作方式。
张小珺:
如果智驾一号位想要推动智能驾驶投入,老板会成为阻力吗?
郎咸朋:
没有,反而李想一直在催促我:郎博,我们自动驾驶怎么还是慢了?赶紧加快速度。
张小珺:
其他人不转,是他们Corner Case解决得比你们好?
李想:
有些企业Corner Case解决得比我们好,他会招很多的人,5倍、10倍的人,一个路口一个路口解决。不但解决规则算法Corner Case,甚至还自己有地图,修地图的Corner Case。
张小珺:
过去2年在AI上,你有什么哇塞Moment吗?
李想:
ChatGPT肯定是,我们内部还是有很多哇塞。
一个印象最深的是,我们决定启动端到端,并匹配好资源,准备好200人团队,他们训练了几十版模型,第一版放到车上,当时郎博让我们来试,我跟经纬中国合伙人张颖在北京研发总部正好就一起试。
张颖坐主驾、我坐副驾,当时我就很惊讶:这一个月的训练,比过去3年做的东西,进步速度要快。
张颖之前试过无图NOA,当他试到端到端时,发现这跟人很相似,甚至在一个路口,旁边有辆车为了躲行人,往我们这边躲时,这个车也适时避让。
他问为什么能躲那么快?我说端到端响应速度,快了好几倍,他是One Model,而不是经过4个步骤。
我们下一个大版本更新时,用户可以在车上直接很清楚看到端到端工作方式是什么样,视觉语言模型工作方式是什么样,AI到底是怎么工作。
张小珺:
大家都说理想做智驾,是投入最晚、最慢的,你怎么看?
郎咸朋:
2018年1月,我加入理想时,跟李想讨论过这个问题。
什么才是决定最终智能驾驶或自动驾驶实现的最关键因素?我们当时聊的是数据。
人才可以流动、算法可以提升、算力非常重要,但是只要有健康资金、合理资金使用,也是能买得到。
最重要是数据,数据它是买不到的,必须自己有这样一个非常高质量、规模非常大的数据,才可以做好自动驾驶。
我们要按照节奏来做自动驾驶,刚开始我们要先把车造好、把车卖好,积累更多的资金、人才、数据,到了一定时间点,再大量投入,达到更好自动驾驶的效果。
现在结果上,也是能看出这一点:我们自动驾驶的节奏,是非常好的。
张小珺:
什么时候,理想意识到,智驾对于卖车是有帮助的?
郎咸朋:
实际表现看,是从2024年开始,2024年智能驾驶对销量有非常好促进作用。
我们2月AD Max交付量占比,只到20%左右,到2024年下半年,超过50%,这是实打实的业绩。
早期大家认为自动驾驶是一个功能,它跟座椅加热没有大的区别,没有解决用户日常出行的舒适性。
直到现在我们用AI做自动驾驶,端到端+VLM真正解放用户长时间驾驶疲劳。
当我们能达到综合城市+高速综合接管里程MPI 100公里、几百公里时,大家就真正愿意为自动驾驶买单。
张小珺:
理想提出有监督智能驾驶,跟自动驾驶L1~L5传统分级,有什么区别?
郎咸朋:
这里面体现我们对自动驾驶研发的思路差别。
之前很多人认为L3自动驾驶是L2辅助驾驶延续,只要把L2辅助驾驶的场景越做越多,总有一天能无限趋近L3,甚至可能就能够做到L3。
我们看来,L3或者有监督智能驾驶,并不是L2延续,而是L4或者自动驾驶的先导程序。
我们是锚着未来自动驾驶能力去研发、成长、迭代,而不是沿着过去一套用L2思路,做现在的自动驾驶。
张小珺:你说自动驾驶是能力、辅助驾驶是功能,两者本质区别是什么?
郎咸朋:功能是预设条件,能力是应对所有条件,你不可能穷尽所有预设。
功能的话,还是用上一代软件1.0方案做自动驾驶。最大问题是在研发之初,就要清晰设定所有条件、所有边界,以及最终确定性的结果,这在自动驾驶里非常困难。
能力的话,是用AI方式做自动驾驶。当我们把自动驾驶当成能力开发,从最本质思考人是怎么学会开车的。
最开始人去驾校学习,掌握基本驾驶技能,再考试。考完掌握基本能力后,作为实习司机,一边实践、一边提升能力,慢慢成长为老司机。
我们系统1+系统2的方案,让自动驾驶系统,拥有这种能力去迭代与成长,随着数据量增长,它会慢慢让性能随之提升,这个是大家经常说的规模效应。
郎咸朋:我们已经验证出来。这不是我们发明的,所有大模型应用都符合这种规律,也就是说数据规模与数据质量增长,会带动性能增长。性能增长是接近于线性,这就是我们用大模型最本质的好处。
张小珺:
有监督智能驾驶阶段,理想交付给用户的产品长什么样?
要想实现有监督智能驾驶,一个前提是实现车位到车位,也就是解决最前面100米与最后面100米。以前智驾是从干道开始,现在可以从小区车位开始,包括园区道路、泊车、城市道路,还有高速与收费站ETC都会全部打通。
高速城市全场景升级端到端+VLM,以及创新的AI推理可视化的交互,将在近期随OTA全量推送给所有的AD Max用户。
郎咸朋:
按照现在的端到端+VLM这套体系,能力继续迭代的话,我们是有希望在2025年实现L3。
张小珺:
面对李想年初对智驾发火,你的职业危机是什么时候解除的?
我们目标是2024年,综合MPI(城市+高速综合接管里程)做到100公里接管一次的能力。
这个接管不是安全接管,不是说你要撞车了才接管,是用户觉得车开得不符合体验、不舒服的接管。
到2025年、2026年,我们会逐渐提升至500公里、甚至1,000公里以上。
慢慢让大家对智驾越来越自信、越来越依赖。
张小珺:
要实现这样的目标,需要储备多少算力与数据?
郎咸朋:要达到500公里的综合MPI(城市+高速综合接管里程),预计需要2,000万视频片段Clips水平。如果2,000万Clips,从不到5%的老司机筛选,这里隐含的数据量,要达到50亿公里、甚至上百亿公里水平。
理想AI Talk访谈实录03、李想从天花板到瓶颈?
张小珺:
为什么车企要自研大模型?这个决策是怎么做出的?
陈伟:
这个事情也是逐渐达成共识,我们当时已经把线上关于自然语言处理的技术,切换到预训练模式下,任务型对话,能够在车里面,做车控、媒体、导航这样非常多垂域的覆盖,上面用预训练模式能够快速高效、高质量完成这样能力。
2022年底,ChatGPT发布,我们看到大模型带来的认知智能与语言智能突飞猛进的变化,这件事对我们有非常大震撼。
我们内部也在想,为什么我们没有快速考虑把这个模型架做得那么高、那么大。
后来想哥提了一个话题,他说现在我们应该回归用户体验,核心问题在认知智能上。
认知智能这件事,我们需要考虑怎么把技术做升维,能够用更厉害、更先进技术,把理想同学认知快速拉上来,把天花板拉高。这件事,对我们后面做基座模型,我觉得是指引性的状态。
我们必须要从基座,从底层开始建设,这样未来我们在做更多技术创新时,产品与研发才能有更快速迭代,体验才能持续做创新,而不是只做行业的平均水平。
张小珺:
作为后来者,你们准备怎么追赶ChatGPT?
陈伟:
我觉得OpenAl现在是整个行业标杆,除了目前OpenAl宣称进入L2推理者以外,绝大部分团队现在停留在L1聊天机器人阶段。
在这样一个状态下,技术处于早期,我们在做无限游戏。探索边界不清晰的情况下,我们最重要的事,是把握住目前第一性原理规模效应Scaling Law。
我们迭代非常快,2023年底12月,OTA 5.0之后一直到现在,Mind
GPT云端大模型已经迭代30多次。
陈伟:
Mind GPT到现在为止,一共经历3代。
2023年4月,Mind GPT 1.0第一版模型出来,到2023年底时,我们车机OTA 5.0发布这个大模型的上车,是行业第一家把大模型推动上车的公司,也是汽车行业首家通过国家大模型备案的。
2024年中,我们完成 Mind GPT 2.0变化,对我们算法团队来说,除了关注模型效果的提升,还要关注整个训练效率与推理效率。
Mind GPT未来模型架构,肯定会是混合专家模型MoE+Transformer结构,会持续往前迭代,我们在MoE模型上线时,相较Mind GPT 1.0大概翻了一倍,但是推理成本跟Mind GPT 1.0基本保持一致。
Mind GPT 2.0重点在语言理解与知识上,另外一块是在长上下文上有比较大突破,也就是在逻辑推理能力上做了进一步强化。
2024年底,我们会上线 Mind GPT 3.0,这是我们第三代 Mind GPT的能力。
Mind GPT 3.0,相较前面两代核心不同在于,以前我们重点放在语言模型上,但是我们认为未来在人机交互过程中,它应该是多模态的端到端大模型,应该融合整个人机交互的体系里,像语音、视觉、语言这样模态进去,能够理解不同模态,能够在一个模型内完成从感知、到认知、再到表达的完整能力。
这样的好处,是它能够让人机交互的延迟,从以前比如说几秒钟,变成可能500毫秒以内,这样人与机器、人与Al之间的交互,就能像人与人交互一样自然。
陈伟:
我们现在预训练数据规模量,已经到10万亿Token规模,有了高质量的课本知识以外,我们还需要给大模型提供由简单到复杂、由粗到精的过程,让它逐渐一步一步学习。
我们在预训练后训练阶段,也要构建一套分段学习的逻辑,在数据构建上,我们要考虑怎么能给它建立一套好的学习逻辑,现在重要的是要尽快把强化学习后训练的事情做好。
陈伟:
第一个,是多模态数据,有自动驾驶的,也有理想同学对话模态,这些数据是独有的。
第二个,是用户在产品里自己使用的数据,代表你的场景或产品本身场景的一些特性,这也是自己独有的,我们也在构建自己数据飞轮,争取能够把这些数据能力,进一步发挥出来。
张小珺:
理想同学跨越到L3智能体的点,会是什么?
陈伟:
对于逻辑推理,更重要的是做好子任务分解以后,还要让它针对自己思考方式做更多发散性思考,在每一个思考路径上,做出自己反思,做到自我纠错。
甚至忽然间碰到死胡同时,还能回溯回来,我觉得这是非常强的思考能力。
我们重心,是希望能够实现从L1 聊天机器人ChatBot、到L2推理者的变化。
我们定义L1,有两个核心特点,第一个是能够实现多模态,人就是能听会看,我们认为语音与视觉加入到大模型,是非常关键的。
第二个是指令遵循的能力,能够听得懂人在跟它讲什么,再复杂的命令,也能听得懂,能够比较准确地执行。
支撑理想同学的技术,是Mind
GPT的多模态智能体技术,理想同学走到L3时,Mind GPT应该长成的样子,是多模态智能体。
张小珺:
现在大家都觉得预训练规模效应Scaling Law达到天花板,这对中国团队影响是什么?
陈伟:
如果我们想做好后训练,我们依然需要有好的基座模型,我们需要具有自己预训练的规模效应Scaling Law。
这件事情短期内会出现,会传出来有些公司在模型做得更大以后,效果可能没有想象中明显,我认为这个可能还是一个从AI算法到Al infra之间,目前有些要待攻克的问题。
第二个点,我觉得规模效应Scaling
Law本身在解决的问题,是模型的效果,与数据、模型规模之间的关系。
我们越来越觉得数据不只是规模的,需要有高质量的数据,才能把规模做上去,才真正有价值。
这个过程中可能大家对规模效应Scaling
Law的看法,也会有一个粗到精的过程,理解才能更深刻,我认为这个肯定会是大模型时代的第一性原理。
张小珺:
第一次听李想说,他要做一个AI企业时,你在想什么?
陈伟:
大家有一个充分共识,AI技术是未来最大机会。
我们内部做了非常长时间关于AI战略讨论,最后做决策,主要基于几点,对用户的理解,对行业发展趋势的判断,对市场,对竞争,还有对自身的分析。
当我听到这个消息时,我觉得是自然而然,必将发生的事情。
想哥是非常坚决的,他说,如果我们要是在未来不做AI,我们什么都不是。
张小珺:
你觉得理想汽车有这样技术基因吗?你们创始人不是有技术背景的人。
陈伟:
理想汽车创造爆品背后的这种逻辑,是我们推出的产品,都是之前行业没有见过,有我们非常多背后的技术创新,这些都是李想带领团队做出来的。
大模型时代来了之后,AI从业者,大家对技术这块认知与想法,可能都需要重构,包括技术栈也需要重新迭代。
我觉得大家对于这件事的认知,都在同一个起跑线上,那就取决于学习速度,李想恰恰又是学习速度非常快的人。
在几个月前,OpenAl o1推出之前,他当时跟我们说我们的重心,不要只放在基座模型训练上,要花更多精力放在模型的后训练这件事上。
OpenAl o1发布之后,整个大模型训练范式,跟他几个月前判断非常一致。
我觉得还是要思考一些本应属于用户的价值,这些价值今天没有实现,影响它实现的障碍到底是什么?这是最重要的。
比如大家都觉得电动车很好,充电很难,这是全行业难题,我们怎么解决?我们有了增程,有了5C,有了自建充电网络。
它是个取舍,你得知道自己想要什么。能够像谷歌克制变成一个搜索框,像OpenAl克制变成一个对话框,这需要巨大能力,简单所以丰富,不是复杂所以丰富,复杂就僵化,这是我们解决问题的方式。
张小珺:
你对产品了解更深,还是对技术能力认知更深?
李想:
过去我们提供的东西叫功能,功能最主要获取方式是体验,通过不同产品,获得不同体验,判断功能价值。
AI时代看能力,必须得搞研究,对技术方向进行有效判断,再搞技术研发,再产品化。
张小珺:
没有上过大学,会让你在社会中遇到更多挫折吗?
李想:
本质上没有什么挫折,它不影响我学习,不影响我获取知识。
唯一遗憾可能是,我人生中,缺少这么一段大家都有的体验,在这方面,跟大家没有共同的语言。
张小珺:
你现在欲望是什么,要做1万亿市值的企业吗?
李想:
1万亿市值,不是我的欲望,只有成长是我的欲望。
经营公司,有两件事情是最重要的,一是推出长远有价值、有意义的产品与服务,要做判断、要出题、要训练、要投资。
二是设定好有向往感、有意义的目标,目标是特别有效的管理方式,1万亿反映对用户的价值,也反映行业地位,它不是空洞的,背后还有很多东西要做。
李想:如果不能实现L4自动驾驶,我们肯定不能迈入万亿俱乐部。
一定要采用完全不同商业模式,还有非常好的能力来支撑。
技术、产品、用户三个层面的高速增长,是最顶级的企业都具备的特质。
科技说:马斯克、贝索斯、拉里·佩奇/谢尔盖·布林、扎克伯格、黄仁勋、Vitalik Buterin、Brian Armstorng、Jack Dorsey、孙正义、华为、马化腾、张小龙、张一鸣、王兴等
投资说:巴菲特、芒格、Baillie Giffrod、霍华德·马克斯、彼得·蒂尔、马克·安德森、凯瑟琳·伍德等
元宇宙说:Meta/Facebk、苹果、微软、英伟达、迪士尼、腾讯、字节跳动、EpicGames、Roblox、哔哩哔哩/B站等
星际说:中国国家航天局、NASA、历年国际宇航大会,SpaceX、Starlink、蓝色起源、维珍银河等
消费说:亚马逊、沃尔玛、阿里、京东、拼多多、美团、东方甄选等
每个系列聚焦各领域全球顶尖高手、产业领军人物,搜集整理他们的致股东信、公开演讲/交流、媒体采访等一手信息,一起学习经典,汲取思想养分,做时间的朋友,做长期主义者。
六合年度报告全库会员,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
六合商业研选付费专题报告,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
元宇宙专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能电动汽车专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,
认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态
|2016 GNEC 新经济新营销峰会