专栏名称: 晚点LatePost
晚一点,好一点。这是《财经》杂志与小晚团队联合推出的新品牌。全部一手采访,没有二手信息。做你最信任的商业新闻媒体。
目录
相关文章推荐
APPSO  ·  这个比Manus更早的AI ... ·  11 小时前  
小众软件  ·  离大谱,AI ... ·  昨天  
APPSO  ·  阿里董事长:AI 市场规模至少 10 ... ·  2 天前  
51好读  ›  专栏  ›  晚点LatePost

对话星海图赵行、许华哲:机器人的寒武纪大爆发,卡点在大脑

晚点LatePost  · 公众号  ·  · 2024-11-20 19:22

正文

具身智能没有现成答案,只能去找最有希望找到答案的人。

文丨张家豪

编辑丨程曼祺

“太难选了,实在挑不出。” 一位密切关注具身智能的早期投资人近期告诉我们,他们在 5-6 个整机公司里犯难,于是转而投资电机等机器人零部件企业。


难以决断,是前沿科技投资和创新的常态。越新的领域,往往越没有明确、清晰的技术与商业路线。


自 2023 年火热至今的通用具身智能和人形机器人正处于这个 “八仙过海” 的时期。


有的公司像特斯拉那样做全人形机器人,有的公司则推出没有腿或没有手的仿人形机器人;有人相信操作价值更大,有人相信运动能力更重要;有人相信端到端模型是机器人的终极方案,有人则认为,就像人脑分大脑、小脑,分层模型组合更可行……


当具身智能没有现成答案时,钱和资源只能去找最有希望找到答案的人。


刚在本月初获得高瓴创投、蚂蚁集团、米哈游超 2 亿元 Pre-A 轮融资的星海图,可能就汇聚了一群能力互补的年轻创业者,他们正在探索通往通用具身智能的路。


星海图的四位联创中,两位是任教于清华的青年学者:赵行和许华哲。


赵行是 MIT 计算机视觉博士,后在 Waymo 担任研究员。2020 年回国加入清华交叉信息学院。许华哲在伯克利获得博士学位,后在斯坦福博士后,是清华 “Embodied AI(具身智能)” 实验室负责人。


许华哲长于具身智能的操作,赵行则研究视觉感知和导航技术,二人的专长分别对应目前具身智能的两个核心模块——机器人的智能操作能力,和机器人完成任务所需的环境感知能力乃至物理规律理解能力。


理想汽车目前的自动驾驶方案是端到端 +VLM(视觉语言大模型),其中 VLM 正是理想和赵行实验室的合作成果。


星海图股东之一的百度风投,也投资了智元机器人和有鹿机器人。百度风投刘水说:星海图的特点是 “全栈技术能力强”。


一位接触过星海图但并未出手的投资人也说 “这个团队里有两张 AI 好牌”,即赵行和许华哲。


两位研发背景的联创之外,星海图 CEO 高继扬和联创兼机器人整机产品负责人李天威则有业界经验和工程能力。


2021 年,在 Waymo 与赵行共事过的南加大博士高继扬回国加入智能驾驶头部供应商 Momenta,两年里升到技术总监,带领一个 100 多人的技术团队,研发高速 NOA 系统,经历了智能驾驶从研发到商用落地的过程。


目前在星海图负责机器人本体研发的李天威硕士毕业于伦敦大学学院,他是高继扬在 Momenta 的同事,负责 SLAM(定位与建图)研发工作。


除了有希望找到答案的人员组合,关键还有多想找到答案。2023 年中,当高继扬邀请赵行一起创业时,赵行曾问他:做什么会让他觉得 “即使失败也不遗憾”,高继扬说,他真正想做的是智能机器人,“这是这个时代最大的机会”。


自去年底开始正式运营后,星海图用两个多月时间做出了机械臂,半年左右时间做出了机器人本体。


星海图仿人形机器人 R1


但星海图更强调 “脑”,他们在多个场合反复讲 “一脑多形”。


赵行说:他看到的机器人终局是,未来会出现一个像寒武纪那样的机器人物种大爆发——各种形态的机器人会在我们的社会中完成各种任务,但都由一个通用的 “大脑” 来控制。


他认为,要做出通用机器人,最重要的不是物理形态,而是能适应各种形态的、相对通用的智能。这就像哺乳动物形态各异,但都有基础的感知、判断、运动能力,部分还具有会使用工具等相对高级的智能。


星海图正尝试探索目前尚无团队做到的事:开发出相对通用的 “具身大模型”。


他们有一些独特的技术和商业判断:比如在现阶段选择了没有灵巧手和双腿的仿人形机器人 R1,专门开发了同构的遥操硬件,以探索遥操的商用价值和降低数据采集成本;除了具身操作模型,星海图还做了大部分公司暂未尝试的空间智能引擎,以帮助机器人获得高质量的数据。


技术能力和判断,是科技创业成功的前提,但不必然导向成功。


赵行与许华哲都没有选择当 CEO,而是以首席科学家的身份加入具身创业潮。他们说,具身智能太难了,要 “一个好汉三个帮”。


以下是我们和赵行、许华哲的对话:

具身智能太难,“一个好汉三个帮”

《晚点》:有投资人告诉我们,星海图的几个联创,每个人单独出来也能融到钱,为什么决定一起创业?


赵行:能融到钱不意味着能做好,具身智能这件事太难了。我们最开始就觉得要 “一个好汉三个帮”,彼此互补。


《晚点》:你们如何互补?


赵行:我这边更多负责感知和移动导航,华哲负责操作,天威负责整机,本体、中间件、软硬件系统。继扬作为 CEO 全盘都要负责。


我们的算法分空间智能和操作智能,空间智能是操作智能的基础,提供对于物理世界的理解,我做空间智能更多,实现的能力是感知和导航。


《晚点》:能组成这个阵容,是按图索骥,还是彼此相识已久,都有创业想法?


赵行:我和继扬在 Waymo 就是同事,他很早就开始看国内的机会,后来加入了 Momenta。2023 年年中,继扬邀请我创业,我问了他两个问题,一是做哪件事情,就算成也不会觉得遗憾;二是,如果这个公司做不好,怎么办?


关于第一个问题,他认为这个时代最有价值的事就是具身智能;关于第二个问题,我们都认可这个团队,重要的是,团队能持续一起做有价值的事。


许华哲:创业一直在我的规划里。去年五月末,我和赵行一起去非洲参加学术会议,刚好聊到了他们的创业计划。我想过现在创业会不会太早,以及要不要自己做。后来我觉得,创业只有非常小的窗口期,有一个高执行力、高效和野心勃勃的 CEO,我也不一定非要追求自己当一号位。


《晚点》:雷军多年前看过一家明星自动驾驶公司但没投,因为他觉得三位联创虽然都很厉害,但股权比较平均,关键时刻可能很难有人拍板。你们也汇聚了很多牛人,怎么避免谁都不服谁?


赵行:我们就是继扬来拍板。继扬比较均衡,对工程、技术、商业都了解。


《晚点》:北航机器人研究所的王田苗认为,研究者或学者创业,关键的一点是看能不能全职。两位目前都在清华大学有教职,如何在创业和研究之间分配精力?


赵行:首先,产业转化是我们重要的工作内容,我们也只做了星海图这一家公司。


另一方面,做具身智能本身也需要持续接触前沿技术。我反而会担心,只在公司闷头干事,干了一年后发现这个世界发生了变化。


就像空间智能这件事,我们去年下半年开始讨论,上半年决定做,就是在学术发展过程中看到了这样的机会。科研和创业是互相激发的过程。


《晚点》:为什么认为 2023 年就是具身智能的创业窗口?不看好这个方向的投资人告诉我们,他对 “5-10 年后才发生的事没兴趣”。


赵行:大模型、ChatGPT 的火爆,让大家对具身智能有了更多信心,各界都在投入更多资源;更多顶尖人才也都在做这个方向:软件的、硬件的、运营的。从这些角度看技术供给,我觉得更乐观了。


《晚点》:自动驾驶,当年也是所有厉害的人都往那个方向涌,但十年过去,无人驾驶仍未大规模商业化。


赵行:自动驾驶有一个巨大的坑是安全性。一个人开车平均 10 万公里出一次事故,但自动驾驶做不到,所以大家退而求其次去做辅助驾驶。


而具身智能不存在要求巨高的单一场景,需求非常分散,所以特别适合创业公司。


如果有一个单一的巨大机会,巨头一定会冲进来自己做。大厂已经是一万亿了,它要的是变成十万亿的机会,具身智能现在还不是一个十万亿的机会。

“卡点在脑不在形”

《晚点》:星海图一直强调一脑多形,你们认为脑重要,但现在也有不少具身智能创业公司是先做手、脚、关节。


赵行:我们觉得具身的终局是一脑多形。未来会出现一个像寒武纪那样的机器人物种大爆发:各种各样的机器人会在我们的社会中完成各种各样的任务,但都是一个通用的 “大脑” 来控制各种本体。


怎么到达这个终局?我们的路径是 “智能定义本体”。具身的两条技术线:智能和硬件本体,现在真正的卡点不在造出本体形态,而是怎么把 AI 和智能做好,具身智能的卡点 “在脑不在形”。


做好智能,最大的方向是要真正做出具身智能大模型。现在还没有人真的实现,这也是星海图努力的方向。


《晚点》:我们可以分开来谈,先说本体部分。如果卡点不在 “形”,为什么你们没有做最完整的人形,而是只做了仿人形:你们的机器人没有双腿,也没有灵巧手。


星海图全尺寸双臂仿人形机器人 R1







请到「今天看啥」查看全文