专栏名称: 晚点LatePost
晚一点,好一点。这是《财经》杂志与小晚团队联合推出的新品牌。全部一手采访,没有二手信息。做你最信任的商业新闻媒体。
目录
相关文章推荐
哈佛商业评论  ·  职场制胜的关键,在于看清公司里的权力地图 ·  2 天前  
FT中文网  ·  2025财政发力的痛点和共识 ·  2 天前  
哈佛商业评论  ·  一场不浪费时间的会议,到底该怎么开? ·  3 天前  
51好读  ›  专栏  ›  晚点LatePost

“稚晖君” 停更这一年:想赢下人形机器人,要像运营大公司那样去创业

晚点LatePost  · 公众号  ·  · 2024-09-03 22:58

正文

许多基础问题还没搞清楚的人形机器人行业,就要面临激烈竞争。

文丨贺乾明

编辑丨程曼祺

我们下午 3 点见到彭志辉时,他还没吃当天的第一顿饭。一日一餐是彭志辉的常年状态,他觉得自己 “习惯了,不影响活着,吃饭比较浪费时间”。


2023 年 2 月,彭志辉参与创办智元机器人,任 CTO,致力于做出商业化的人形机器人。在这之前,他更为人熟知的身份是 “天才少年” 和 B 站 “百大 UP 主”。


彭志辉 2017 年开始以 “稚晖君” 为网名发布各种硬核 DIY 视频,现在他的 B 站账号有 250 多万粉丝,同体量的 UP 主通常是团队运作,而他是一个人兼职做。 不少人觉得 “全栈工程师” 难以概括他的能力,称他为 “溢栈工程师”。


智元机器人成立后,彭志辉把一切重心放到了公司,他基本没休过周末。B 站最后一次发布自制视频是 2023 年 4 月。


极致地投入,是因为他想成就更大的事业。“我们的愿景是用智能机器创造无限的生产力。” 彭志辉说。


也因为人形机器人行业许多基础问题尚未解决,就要面临激烈竞争。去年至今,中国已出现不下 20 家人形机器人公司。想把机器人送进工厂的智元机器人,还要与 2016 年前后成立的上一波 “AI+ 机器人” 公司竞争,它们服务客户更久、经验更多;再往后,更大的威胁是对具身智能蠢蠢欲动的车企,它们能调动的资源远超一般创业公司,而且有自己的工厂,这是现成的场景。


智元机器人认为,获胜概率最高的方法是 “高举高打”,用一种运营大公司、操大盘的方式创业。


多数同行专心研究一款产品时,智元机器人用一年半做出两代人形机器人,并在今年 8 月一次发布了 5 款人形机器人,还给同行提供数据采集方案。今年初,智元机器人还发布过一款商用清洁机器人。


智元机器人 8 月 18 日发布的 5 款产品。


大部分人形机器人公司会先侧重某个技术方向,有的主攻硬件,有的主攻软件智能系统。形态上,有的重点放在上半身的操作能力,有的优先做下半身的运动能力。


智元机器人则 “全都要”:他们做完整的人形机器人,也根据不同场景开发分支形态;他们自研关节电机等核心零部件,也研发 “灵巧手”,还自己开发多模态大模型,同时研究强化学习、模仿学习、视觉模型等当前具身智能的主流技术。


今年 2 月,多数新公司仍在代工组装机器人时,成立刚一年的智元机器人就开始建设上海临港首期工厂,计划年底投产。


“看不太懂”“不是常规的创业公司”,数位科技投资人如此评价,他们很少看到初创企业同时做这么多产品,下注这么多技术方向,如果管理和后续资金跟不上,很容易出问题。


彭志辉说,他们不是有意要如此,而是行业特点使他们必须这么做:“人形机器人的研发涉及硬件、软件、算法、供应制造等一大堆问题,系统工程极其重要。在技术实现上,有的是工程问题,有的还是科学问题。这个行业空间大、门槛高、变化快,人才、资金和商业成果最后都会向头部集中,如果只是小打小闹,很难保持领先。”


最多资本投票向智元机器人。成立一年半,这家公司已至少融资 15  亿元人民币,估值达 70 亿元人民币,投资方有高瓴、红杉、高榕、蓝驰、比亚迪、上汽、三花智控、临港新片区等 20 多家机构。智元还在今年初的股东会上给部分投资机构颁了奖。


纪录片导演竹内亮曾在拍摄彭志辉时,惊讶他精通如此多的跨领域技能,问:“有没有你不会的东西?” 彭志辉说:“不会生孩子”。这次我们又问了这个问题,他说:“不会停止学习”。


彭志辉摆在工位上的书,大都是《托马斯微积分》《编译原理》等教材,唯一的例外是《埃隆·马斯克传》。马斯克是他的学习对象之一。


“在学校里学习更多是自底向上,先打好基础然后做上层应用,出了校园之后更多是自顶向下,以项目导向,缺啥学啥。” 彭志辉说。聊到时间管理方法,他说是 “操作系统中的抢占式调度”,动态调整任务优先级,允许打断,但是任何时间都专注于当前的任务。


他不喜欢 “天才少年” 的称呼,他觉得教科书中那些能改变人类发展进程的科学家才是天才。


相比过去用几个月就能独自完成的小型项目,参与创办一家公司开发成功的产品要难得多。他要从单兵作战走向带团队协作,做出来的东西不能只是酷,还要能赚钱。这是一场新的、更复杂的学习。


以下是《晚点》与彭志辉的对话:

耐心地冲刺,留在牌桌上

《晚点》:回到起点,为什么 2023 年决定创业?


彭志辉:人形机器人本身不是新事物。我做人形(机器人)比较早,16 年还在学校时就创业做了原型机,那时 “具身智能” 还没出现,主要做本体(机器人硬件部分),还拿过 500 万投资。


这两年具身智能跟人形机器人这么火,并不是本体有了什么黑科技,最主要的还是 AI、大模型的出现让机器人可能在本体之外有更多应用价值。我在华为昇腾就做 AI 计算,这个趋势看得比较清楚。这是我出来创业的一个原因。


《晚点》:如果你想在华为做,应该也会得到支持。为什么选择创业?


彭志辉:风格问题。华为在技术方面主要是搞基建,比如操作系统、芯片、数据库等非常底层的根技术。


而机器人是一个非常新的赛道,特别是 AI 机器人,更适合一些迭代比较快的团队。创业不仅要有一个好点子或好技术,更重要的是在正确的时间点做正确的事。


《晚点》:现在创业做人形机器人是正确的时间吗?它需要的硬件、材料、能源等技术还不成熟,有些还在科学探索阶段。一位资深科技投资人就说,他对 5-10 年后才会发生的事没兴趣。


彭志辉:我们也没想过短期就做成这件事。我们要求大家 “耐心地冲刺”,一方面迭代和创新速度要非常快,一方面要有耐心。


短期市场上会有各种正、负反馈,但对一家初创公司,最重要的是留在牌桌上。


《晚点》:留在牌桌很重要的一点是钱够多。智元的融资速度和规模都领先同行。怎么做到的?


彭志辉:我觉得可以换位从投资人的角度看,他们为什么会选我们?


首先我们有非常硬核的创始团队背景;又有全栈技术布局:不只做本体,也不只做具身 AI,我们是本体、具身、数据都有布局,能力相对友商可能更全面;其次我们对整个赛道的理解也非常务实,一直在积累量产的系统能力,团队的执行力超强。


去年发布会(2023 年 8 月)时,我们整个人形研发团队才不到 50 人,一年后的现在已经超过 300 人了。规模敢增长这么快,前提是我们想清楚了要做什么事情、各个阶段的技术实现路径,以及商业化的逻辑,这点也是投资人比较看重的。


《晚点》:智元长期想成为一家什么样的公司?有什么对标对象?


彭志辉:比如贝尔,贝尔发明电话,改变了大家信息沟通的方式。人形机器人未来可能也会改变社会生产力。我们的公司愿景就是 “用智能机器去创造无限的生产力”。

智能最终决定机器人能做什么

《晚点》:创业一年多,人形机器人哪些方面比你预想的更难?


彭志辉:从 0 做到 40、50 分,甚至 60 分都不算太难,但再往上就非常难。


本体成熟度还不够。比如大部分人都在卷两条腿走路,而双臂的灵活度,灵巧手这些都还处于初级状态。然后是智能。现在大家都往模仿学习方向尝试,但它真的能在复杂开放环境中达到很好的效果吗?还有触觉,声音跟视觉结合起来的多模态融合感知、操作等,做得也不是非常好。这里面有一部分是工程问题,还有一部分还处在科学问题阶段,业内还没有看到非常成熟的解决方案。


我们一边落地一边做预研,整个节奏要把握得比较稳,才能体现我们的竞争优势。全栈也是我们的一个优势,所以未来可能会走得更远一些。


智元机器人研发的灵巧手,与人手还有差距。人手有 27 个自由度、行动灵活,遍布高敏感的触觉神经,力控能力强大。要做好灵巧手,灵活、耐用、稳定且成本可控的硬件部件和材料只是基础,人手还具备手、脑协同能力,比如人能接住移动的物体,是因为人脑对重力、加速度等物理规律有认知,因而能预判轨迹,身体又有运动能力,才能完成这个看似简单的动作。


《晚点》:我们了解到,智元在机器人的智能上投入的人手更多。你们认为智能比本体更重要?


彭志辉:本体肯定是基础,但我们一直觉得,(人形机器人)最核心的其实不是本体,而是它基于本体,能完成什么实际任务,产生什么有价值的应用。


所以本体的价值一定是通过具身来体现,你可以看到我们起名智元的初心:“智” 就是具身智能,“元” 就是人形机器人本体的两条腿(象形)。


《晚点》:一个人形机器人能站起来到能走,再到能上台阶,是智能问题吗?


彭志辉:它其实更多的是智能问题,而不只是硬件问题。高阶的运动能力主要靠大脑体现,在很多运动项目中,正常人跟运动员的身体没有本质区别,运动员更多是长期训练中让大小脑协同,对环境的感知、反馈达到了更好的状态。


《晚点》:在获取训练数据的方法上,行业里也有分歧。比如有公司认为,遥控操作机器人采集数据算不过来账,应该用大量仿真数据。智元为什么造上百台机器人专门采集数据?


彭志辉:数据来源就那几类:互联网数据、仿真数据、真实采集的数据。如果只靠仿真和生成数据,会有可能出现用 ChatGPT 训练大模型的情况,出现幻觉、Sim2Real Gap 等问题。所以真机数据必不可少,价值也最大,但它的量不会有仿真数据那么大,可能占 10%。


还要考虑采集成本,有些公司硬件能力没么强。我们本体做得足够好,所以才有条件在今年下半年有几百台机器人能采集数据。我们会找到一些场景,让人遥控操作不能自主执行任务的机器人。让客户为这一部分的功能买单,降低硬件成本。



《晚点》:在你的设想里,通用人形机器人最终会是什么样的?


彭志辉:就科幻电影里的那种。比如 I,Robot。科幻电影拉高了大家的预期,但我们希望最终能做出来。


《晚点》:那是一种超人的状态,而不是像人。


彭志辉:可能很难有中间态。一旦人形机器人达到正常人类的水平,那它很快就会远远超过人类。


《晚点》:那个未来距离现在还有多远?


彭志辉:我比较乐观,未来 10 年是有希望的。

人形机器人最早落地的场景是 “PPT”

《晚点》:你们说今年是智元商业化元年。其实不少人觉得,人形机器人还处于早期阶段,刚学会走路,没必要这么快去上班。


彭志辉:我们是一家商业公司,商业化是检验成果最有效的方式,把产品卖出去,客户给了积极反馈,才能吸引到更多人才。一个落地遥遥无期、不太有希望的团队,大家也不会加入。


《晚点》:你们说人形机器人商业化路径是先工厂、后家庭,现在处于工厂阶段,他们能做什么场景?


彭志辉:目前最快落地的就是 “PPT”,Pick(抓取)、Place(放置)和 Transfer(转运)。


灵巧手更成熟后,还可以做各种装配工作,因为灵巧手有触觉、力觉等各种复杂感知能力。这个场景的量会更大,我们评估了一下,PPT 可能就只占整个制造行业场景的 20% 不到。


《晚点》:你们说今年就会卖出 300 台机器人。200 台有腿,100 台靠轮子移动。更具体来说,他们会做什么工作?


彭志辉:卖的主要是远征系列,灵犀系列不卖,都开源。


远征系列里,双足(人形机器人)的可靠性和自由度还要进一步迭代,现在更适合做一些体现人机交互能力的场景,主要是服务业。比如我们发布会上展示的汽车门店里的迎宾导览。轮式的就是 A2-W,在工厂里做 “PPT” 那些工作。


智元的人形机器人远征 A2 在汽车门店当导购。


《晚点》:行业里也有一些机器人公司,比如梅卡曼德、思灵等,给机械臂增加视觉、力控能力,用上大模型,在工厂里也能做 PPT,而且他们已在稳定性和成本上打磨了更久。你们新方案的优势是什么?


彭志辉:它们的确是机械臂厂商中最贴近具身智能的公司。我们从单臂演化到了双臂,然后还带一个移动底盘,一些高层的双臂规划上,我们会有一些技术差异化。


比如典型的转运场景中,用单臂搬一个托盘很难实现,双臂做这个任务就更合理。从单臂到双臂,听起来很简单,其实会涉及复杂的力控和双臂配合、环境感知、动态避障、轨迹规划等。更关键的是,以上这些能力我们要做成可以泛化的标准技能,降低机器人的部署成本。


智元机器人 A2-W 在工厂中搬托盘。


《晚点》:智元卖出去的 A2-W,已经能解决这些问题了?


彭志辉:能解决一部分,重点是找到客户需求和我们已有技术的匹配点。我们的投资人也比较给力,确实提供了一些很有价值、能在短期落地的场景。







请到「今天看啥」查看全文