专栏名称: 六合商业研选
六合咨询立足新经济,挖掘明日之星,发现价值,传播价值;国际化视野、多角度观察、深度思考、体系化研究,持续提升研究广度与深度,全面覆盖一级、新三板、二级(A股+美股+港股);深度剖析优质企业商业模式与投资价值,前瞻性洞察行业本质与发展趋势。
目录
相关文章推荐
普象工业设计小站  ·  央视点名!上海老人花2万买保健床垫称包治百病 ... ·  11 小时前  
普象工业设计小站  ·  国风颜值控的福音!11 款国货好物,性价比天花板 ·  11 小时前  
普象工业设计小站  ·  视频退出键在哪里?!水果版定格动画,越看越魔性! ·  2 天前  
普象工业设计小站  ·  一天被问三次!这瓶花香调好闻到爆! ·  3 天前  
51好读  ›  专栏  ›  六合商业研选

【长期主义】第298期智能说:Figure创始人Brett Adcock谈未来100亿机器人世界,宇树创始人王兴兴访谈

六合商业研选  · 公众号  ·  · 2024-09-07 06:30

正文


美国人形机器人公司 Figure 创始人、 CEO Brett Adcock ,近期接受知名播客主 Peter Diamandis 专访,分享近期推出的 Figure 2 机器人产品迭代情况、与科技巨头合作、机器人技术发展、安全性、对社会潜在影响等观点,讨论中国在机器人领域崛起、未来劳动力市场、人类社会演变等话题。

2024 8 20 日,宇树科技发布人形机器人 G1 量产版,售价 9.9 万元起,在 2024 世界机器人大会上亮相。宇树举办媒体沟通会,创始人王兴兴回答媒体采访,主要涉及人形机器人产业现状与挑战等话题。王兴兴认为,目前人形机器人行业最大难题,在于机器人 AI 发展落后通用 AI ,未达到突破临界点时刻。人形机器人 iPhone 时刻尚未到来,可能还需要 3~4 年,不会超过 5 年。

本期长期主义,选择 Figure 创始人 Brett Adcock 谈未来 100 亿机器人世界、宇树科技创始人王兴兴访谈, Web3 天空之城、腾讯科技发布,六合商业研选精校,分享给大家, Enjoy

正文:

全文 30,082

预计阅读 61 分钟

AI 机器人革命: Brett Adcock Figure 2 与未来 100 亿机器人世界
时间: 2024 8 23

来源: Web3 天空之城

字数: 20,209

Brett Adcock Figure Robotics Figure AI 创始人、 CEO ,随着 Figure 2 机器人发布, Adcock 不仅展示技术飞跃,更描绘未来:到 2040 年,全球将有 100 亿台机器人。

这次最新深访中, Adcock 带我们走进 Figure Robotics 创新世界,从 Figure 2 设计迭代、硬件升级,到与 OpenAI 、微软、贝佐斯、英伟达等科技巨头合作,揭示新兴领域背后复杂性与挑战。 Adcock 对未来劳动力市场与人类社会演变,提出远见卓识洞见,强调机器人技术不仅是科技突破,更是创造富足社会的关键力量。

Adcock 还谈到中国在机器人领域崛起,指出中国工程团队以低成本、高速度、强大职业道德著称,这将使中国成为未来全球机器人技术主要竞争者之一。

Figure 2 硬件升级与设计改进 Figure 2 在硬件方面进行全面升级,包括 CPU GPU 能力的 3 倍提升,电池容量几乎翻倍,引入 6 个高效摄像头系统,使其能够更好感知与理解周围环境。

Figure 2 外骨骼设计承载了负荷,减轻整体重量,提高系统可靠性。这种设计,类似航空领域工程方式,显著优化 Figure 2 性能。

OpenAI 、微软的深度合作, AI 集成与智能提升 Figure Robotics 通过与 OpenAI 、微软、贝佐斯、英伟达等科技巨头的合作,成功将最先进的 AI 模型集成到 Figure 2 中,增强机器人智能与操作能力。这种合作,标志着机器人技术向全面实用化迈出重要一步。

Figure 1 Figure 2 迭代演变 Adcock 详细介绍了从 Figure 1 Figure 2 快速迭代策略,特别是在硬件设计与制造效率方面改进。他强调,通过精益制造与持续设计优化, Figure Robotics 正在将先进机器人技术推向市场,计划逐步扩展生产线,实现规模化生产。

未来劳动力市场与社会变革, 100 亿机器人愿景 Adcock 预计,到 2040 年,全球将有 100 亿台机器人,这将彻底改变劳动力市场,让人类从危险、单调工作中解放出来。这种大规模的机器人应用,不仅将显著降低商品与服务成本,还将推动全球经济进入前所未有的富足时代。

系统安全与 AI 伦理 :设计 Figure 2 时, Figure Robotics 特别注重安全性,确保机器人在与人类互动时不会造成伤害。 Adcock 还提到,将阿西莫夫定律之类的道德规则,纳入机器人系统,是未来发展重要方向,以确保在 AI 与人类共存中保持安全与伦理的底线。

中国竞争者的崛起 Adcock 在访谈中,对中国机器人领域的竞争者给予高度评价,特别是中国工程团队在低成本、高效率生产方面的优势。中国企业以极高的职业道德与强烈的成功欲望著称,这将使中国成为未来全球机器人技术的重要竞争力量之一。随着中国机器人技术飞速发展,中国有可能在这个领域与全球主要玩家展开激烈竞争。

主持人 Peter 今天节目中,我们将与 Figure Robotics Figure AI CEO Brett Adcock ,进行深入探讨。他将带我们参观公司,介绍新推出的机器人 Figure 2 。如果你在 YouTube 上观看我们节目,我们会谈论他对马斯克看法,以及他作为乐观主义者对家用机器人的展望,何时可以期待它们的普及,以及他预测到 2040 年地球上将有 100 亿台机器人。

Figure 刚完成一轮融资,从 OpenAI 、微软、贝佐斯、英伟达等投资者,筹集 6.75 亿美元,估值 26 亿美元。我们将讨论他如何将 OpenAI 软件集成到 Figure 2 机器人中。这是一场非凡的对话,也是我最喜欢的对话之一。

Brett 谢谢你的邀请。

Peter 来参观你的办公室非常有趣,那是 2 个月前的事了,那时你还没有推出 Figure 2 。我不得不说,你迭代设计速度非常惊人。自从我在猎鹰 1 号看到 SpaceX 以来,我从未感受到过这种能量,恭喜你。

今天焦点是 Figure 2 ,如果你不介意的话,我们是否可以在播客开始时,快速浏览一下 Figure 2

Brett 可以,我们可以快速浏览一下车间,顺便参观一下办公室。

欢迎来到 Figure 。我们现在有 100 多名工程师,总部设在北加州旧金山湾区。上周我们刚发布 Figure 2 ,这是我们第 2 代人形机器人。目前,我们在加州工厂每周生产一个 Figure 2 机器人,现在已经有几个这样的机器人正在进行测试。

Peter Figure 2 的发布,非常令人兴奋,我知道你的团队即将启动它。对于这家公司,成立不到 2 年时间,你们已经从零发展到现在规模,速度非常快。

能否谈谈 Figure 1 Figure 2 之间主要区别?你们在 Figure 2 中做了哪些升级?

Brett Figure 2 有几个显著升级。

首先,我们将 CPU GPU 数量增加 3 倍,以提升整体计算与推理能力。

其次,我们将电池容量几乎增加一倍,达到约 2.3 千瓦时。电池系统安装在躯干中间,紧邻计算单元与 GPU 。所有电线都内置在机器人内部,没有外部电线、电缆或电子设备,这样设计是为了提高可靠性与整体包装的紧凑性。

我们引入外骨骼结构,机器人所有外壳都承受着负载,这与我们制造第一代机器人的方式不同。这种设计,更类似航空领域做法,比如我上一家公司 Archer 的飞机,外壳承受车辆的负荷,我认为这种系统在 Figure 2 中非常独特。

我们还增加 6 个机载摄像头,提升机器人感知能力,使其能够更好观察周围环境。摄像头分别安装在机器人头部、背部、下半身。外骨骼结构,有助于减轻机器人整体重量。基本上说,零件越宽,刚度越大。

我们发现,一个结构,如果既能承受碰撞载荷,又能保持足够刚度,这是理想的质量权衡。

Figure 1 展示了一个结构与外壳共同承受载荷的情况,这种设计并不理想,结构的尺寸是由碰撞载荷决定的,最终导致在很多方面都出现双倍的质量。

Peter 关于机器人的手部设计,你们是否进行改进?请展示一下它的样子。

Brett 我们现在已经开发到第 4 代机器人,与前几代相比,我们做出许多改进。包括更好的传感器、更优化的包装、更高的质量、更强的结构强度、更快的手指速度。

总体而言,我们在机器人上进行精细操作的灵活性与控制力,都有显著提升。这些改进,使得机器人能更好执行类似人类任务,抓取类似人类物体,提高了机器人通用性。

P eter 这真是太神奇了。它站立高度,大约 5 英尺 6 英寸 /1.68 ~5 英尺 7 英寸 /1.7 米?

Brett 是的,差不多是 5 英尺 6 英寸 /1.68 米。

Peter 非常感谢你带我们快速浏览了一下。你想回到你的会议室吗?我注意到那里有横梁,用来搬运重物。现在在这个设施内,有多少个数字机器人正在运行?

Brett 目前在我们设施里,有不到 10 个机器人在运行。我们现在的生产速度,是每周制造 1 个。

Peter 我注意到你给我展示了 Figure 1 ,然后是 Figure 2 ,接着是 Figure 3 的图纸。

不能详细谈论 Figure 3 ,它看起来非常漂亮。你能谈你的快速迭代策略吗?你如何看待代际更新、重新设计与重建?很多公司喜欢先推出一个产品,然后修复它,长期销售,你的策略似乎不是这样。

Brett 是的,我认为这里的经验法则是,通常需要至少 3 个硬件版本,才能达到相对商业化、可靠、无错误的程度。

我们目标是在极限情况下,让问题成为软件限制的问题,这意味着我们需要真正可靠的硬件,它必须是安全、质量稳定,成本低廉,我们能够高效制造它。

这就像一盏灯,在第一个版本的硬件中,有很多问题需要解决才能做好。这非常困难,就像要把 iPhone 做到完美一样。

iPhone1 的时候,不是世界上最棒的手机,到了 iPhone 3 4 ,无疑成为世界上最棒的手机。

汽车领域情况也是类似,特斯拉跑车为例,它可能不是世界上最顶尖的汽车,我个人拥有 3 辆特斯拉,它们表现非常出色,可能是我拥有过最好的车。

我们目前目标,是在快速硬件迭代过程中,研究应用不同启发式方法,使硬件逐步成熟,进行所有必要改进,确保硬件在某个时刻达到非常成熟状态。

回顾我们第一代硬件 Figure 1 ,主要任务是确保整体架构正确性。工程系统的细节非常重要,例如电池能量来源是什么?是液压还是电池供电?电池化学成分是什么?电池类型是圆柱形还是棱柱形袋装?我们如何处理电池热传播问题?这些问题,仅仅是关于电池本身,而整个系统还有许多其他方面需要考虑。

建造机器人之前,需要做出 100~200 个决定,你不希望处于必须在所有这些方面都做到完美的境地。我认为我们在 Figure 1 中,大部分内容都做得不错;在 Figure 2 中,我们在一些决策上表现得更好。

Figure 2 目标,是打造功能齐全的机器人,集成所有必要系统,无论这些系统是我们自己制造、还是外购,机器人都能够正常工作。

我们制造大部分机器人的组件,包括固件嵌入式系统、控制软件、机载硬件系统、执行器、电子设备、线路、电池系统、摄像头与传感器等。

我们认为 Figure 2 中的功能,已经基本完成,硬件部分也已完成,这让我们感到非常兴奋。

接下来,我们目标是如何将成本,从当前水平降低一个数量级以上?如何获得制造前所未有机器人的能力?

Peter 我知道你提到过一句话:每个人都会拥有一个类人机器人,劳动力将变得可选,这是非常具有挑衅性的话题。

关于每个人都拥有一个类人机器人,我想进一步探讨。你提到要将成本降低 10 倍,马斯克在价格与时间表上通常非常激进,他不总是能准确把握。

我想问的是,你是否认为这些类人机器,人最终会以每公斤总重量的价格来定价?你认为在 10 年或 20 年后,这些机器人实际成本会是多少?

Brett 我们花了 1 年时间,研究如何降低机器人制造成本。答案在于,对整个物料清单成本进行自下而上分析。我们列出大约 1,000 个零件清单,逐项分析,开始了解我们将如何在实际规模上采购这些零件,无论是自行制造还是外购,估算我们可以获得的合同数量、以及相应价格,这非常依赖数量。

我们知道,几乎所有的消费设备或汽车价格,都与制造量高度相关。降低消费电子产品价格的唯一真正方法,就是提高产量,这是我们所知道的唯一途径。如果你真想要降低成本,必须大规模生产这种产品。

我认为在足够长时间内,随着产量增加,成本可以降到每台设备低于 20,000 美元,甚至非常便宜。

Peter 这是令人惊叹的想法。如果我租一辆价值 20,000 美元汽车,每月最多只需花费 100 美元,为什么不买 2 辆?

Brett 特别是如果这辆车还能为你赚钱,比如它可以出去工作,或者它可以完成你白天需要花时间做的事情。如果它真的能像一个真正的公用工具一样发挥作用,你会想要多少辆?

Peter 当我们第一次谈话时,我记得你说过一些令人震惊的话,现在回想起来,非常有道理。

如果我记错了,纠正我,我记得你曾估计,到 2040 年,市场上可能会有多达 100 亿个仿人机器人,你还坚持这个观点吗?

Brett 如果这些机器人,能够完成所有人类能做的事情,我不得不认为我们将能够投入 30~50 亿的劳动力。我看不出,为什么每个人不想拥有一个像汽车或手机一样的仿人机器人。

也许它比汽车或手机更重要,它可以做你不想整天做的所有工作,比如遛狗、喝咖啡、办事、洗衣服,甚至每天回家收拾孩子的玩具。

我可以让机器人,每天花 2~3 个小时收拾孩子玩具,这完全没问题,就像每天无休止的工作一样。

Peter 是的,我可以想象。你说的其他话,也让我大开眼界。

你提到,拥有这类仿人机器人是一种道德责任。随着我们实现 AGI 与数字超级智能,如果我们没有仿人机器人, AI 可能会让我们按照它们意愿行事。如果机器人按照 AI 指示行事,这对人类灵魂来说会好得多。如果我说错了,请纠正我,但这是一个我以前从未听过的有趣观点。

Brett 我认为,一个相当令人沮丧的未来是:我们解决了 AGI ,它却被困在盒子里,无法在物理世界中发挥作用。

为了让 AGI 在现实世界中做任何事情,它必须通过支付工资或其他方式,要求或强迫人类执行这些动作。我不知道你怎么看,这似乎是一个非常令人沮丧的未来。

就像人类智慧的集体意识,被困在那里,想要在物理世界中有所作为,不得不通过工资或强制手段向人类支付费用,这种未来看起来非常可怕。

Peter 我对你写的使命宣言很感兴趣。

我最近看到了你发布的一些文件,根据这些文件, Figure 使命是通过先进的 AI ,扩展人类能力。

我很好奇,文件中没有提到人形机器人,而是强调通过先进的 AI 来扩展人类能力。你是如何走到这一步?你最终将自己视为一家 AI 公司?

Brett 我们将自己视为一家极限 AI 公司,极限 AI 恰好是机器人技术公司。从极限角度看,我们在完成使命过程中面临所有挑战,最终大部分都是 AI 问题与障碍。

我想我们现在都有一个梦想,希望有一天,我们能看到这些机器人在世界上从事非常重要的工作。这对人类来说是真正需要的,有助降低商品与服务的价格,希望带来一个富足的世界。我认为这会释放出大量时间,让我们能够做我们真正喜欢的事情。

Peter 是的,正是如此。如果我们可以把时间花在我们真正想做的事情上,所有人类会如何利用他们时间?

Brett 我认为这是最重要的问题之一。

Peter 之前采访中,我听到你谈到机器人如何实现富足时代。你认为机器人的未来,会如何实现富足时代?你如何描述它?你认为它是什么样?你所说的富足时代,是什么意思?

Brett 我认为,人形机器人的有趣之处之一在于,我们可以将这些机器人直接放入现实世界,无需额外基础设施来运行它们。

你可以将机器人投入劳动力市场,不需要为它们构建新的系统、新的电子设备或其他一切。人形机器人可以直接融入世界一样,第二天它们就可以像人类一样开始工作。如果我们有了机器人,制造角度看,我们最终会制造出更多机器人,我本来想问你这个问题。

这很快就会演变成一个问题:是的,今天的大多数制造业,可以被看作是由一堆机器与人类共同完成。

如果我们能够实现人类级别的制造,理论上你就可以让机器人制造机器人。随着成本下降,这些机器人可以被投入到世界各地工作中。这项工作的成本是多少?这包括你租用机器人的成本,以及土地的成本。如果你在那个设施中,使用可再生能源,这个工作区域的成本将会非常低,产出会非常高。

你可以创造一个世界,这个世界中,商品与服务价格趋于零, GDP 将飙升至无穷大。你可以要求任何你想要的东西,这些东西对于世界上每个人来说,都是相对负担得起的。

Peter 当你观察各国 GDP 时,会发现它们随着人口与能源使用量的增加而增长,这很有趣。人口与能源是工作的基础,这似乎将成为任何想要在未来几十年生存与繁荣国家的必备要素。我认为弄清楚非常重要。

在你使命宣言中,你提到, Figure 目标是开发通用人形机器人,对人类产生积极影响,为子孙后代创造更美好的生活。

这些机器人可以消除对不安全与不受欢迎工作的需求,最终让我们过上更幸福、更充实的生活,我相信这一点。

我喜欢让机器人做枯燥、危险、肮脏的工作,比如打扫厕所、清洁房间,我认为大多数人都在从事这些工作。世界上大多数人工作,不是他们喜欢这份工作,而是他们必须工作才能获得食物或保险,无论情况如何。

最终问题是,我认为这些机器人会取代更多工作。我有个侄女,她是名整形外科医生,我想,机器人将成为我们最终的外科医生。你认为是否有一些工作,是机器人无法承担的,如果我们愿意的话?

Brett 随着时间推移,数字与物理智能机器人,将能够完成越来越多人类擅长的工作。

我认为,我们在过去几个世纪里,已经通过技术看到这一趋势,现在我们看到这一曲线的斜率正在加速,尤其是在大型语言模型领域,这种加速,几乎朝着我们 10 年前无法想象的方向发展。

我认为,足够长时间内,我们将拥有自动化,无论是物理自动化还是数字自动化,我们能够做到的,可能是人类今天可以做的大多数事情。

Peter 我今天早上查了一下,美国目前有 820 万个职位空缺。

首先,我想澄清一点,不是说没有需求或工作机会。

我认为最大的新闻与值得祝贺的事情,是你们刚刚获得融资。对于不太了解的人来说,这次融资非常非凡。作为一名投资者,我感到非常自豪。

Brett 这是一大笔资金,我们以 26 亿美元估值,筹集 6.75 亿美元。我们对此感到非常自豪,吸引许多新投资者,包括 OpenAI 、微软、英伟达,能够得到你们支持,我们感到非常高兴。

这笔资金,将为我们提供足够资源,使我们能够迈出下一步,实现我们使命,将这些机器人推向商业化,使它们真正可行,这正是我们目前所处的阶段。

我们正在发布一些很酷的视频,这很棒,接下来重大挑战是:我们如何让这些机器人,真正加入劳动力队伍,每天都在工作?

我们刚从宝马公司回来,在那里进行将近 2 周全面试验,一切进展顺利,宝马刚发布相关新闻稿。我们计划近期内再次回到那里,继续进行有意义工作,对此我们感到非常兴奋。

这既困难,又具有挑战性,我们在办公室里已经走出舒适区。当我们回来时,我们充满活力,觉得我们可以做到,这一切是可行的。

是的,这里每个人都非常激动,我们有机会在未来几年内尝试实现这一目标。我不是说融资后,有什么阻碍了我们。在公司目前阶段,我们拥有比所需更多的现金。我们有 OpenAI 这样优秀合作伙伴帮助我们建立模型,有微软帮助我们进行训练,英伟达在 GPU 硬件与其他模拟工作上给予支持。

我们拥有世界上最好的 AI 机器人团队,我们现在有了第二个模型,我认为这可能是世界上最好的人形硬件。我们正在进行世界上最好的 AI 学习工作,已经看到隧道尽头的一丝曙光,机器人真正能够做的事情。我们现在都在为此努力工作。

Peter 你会说你们现在所做的事情,只有在当前 AI 发展状态下,才有可能吗? AI 与大量算力,是让这一切成为可能的关键因素吗?

我们已经谈论机器人技术超过 50 年,我在高中与大学时也曾经建造过机器人。我们可以称它们为机器人,但它们远不及真正的机器人。

现在是 AI 的进步,让我们开始思考:是否应该承诺更多?你投入大约 1 亿美元的自有资金来启动这个项目,这对企业家来说是一个重要的举措。

Brett :我认为有几件事与以往不同。

首先,是整个 AI 生态系统的变化。 AI 不仅是模型,还包括用于训练、推理、部署的整体基础设施,例如支持大规模模仿学习与强化学习的深度学习算法。

AI 几个关键构建模块,已经成熟到可以部署这些策略的地步,比如嵌入在现实世界中的策略,它们能够真正发挥作用,这真是令人难以置信。

上个月,我刚从城里乘坐 Waymo 回来,那种体验非常特别。只要有足够数据, AI 就可以像人类一样驾驶,我们机器人也是如此。当你看到我们机器人在工厂里执行我们正在研究的新一代任务时,那种感觉非常神奇。

我认为另一个重要的变化,是整个硬件系统的进步。 很难说 10 年前,是否真的有可能实现现在技术水平,比如执行器的扭矩密度、电池与电池系统能量密度。

10 年前,最好的仿人机器人,大多采用液压系统。这些系统的液压压力高达 3,000PSI ,到处都在漏液压油。到处都在漏油,这使得它们很难与人类共存。如果这些系统放在人旁边,可能会对人造成致命威胁, 10 年前的架构决策是错误的。

我不确定 10 年前是否有可能,即使有了 AI ,也能建立一个像现在这样高效的机电系统。我可能会认为那时是不可能的,我认为这是多种技术的融合。

Peter 2025 3 月,我将举办 Abundance Summit 的主题就是融合。感谢你们参与,我认为你们正在构建的,正是融合技术的典范,这些技术使得新系统与新商业模式成为可能。

你最初是如何与 OpenAI 建立联系的?这是一个重要转折点。

Brett 几年前,我认识 Sam ,我们逐渐加深了解,并在 2023 年一起度过很多时间。他们最终决定重新进入机器人领域,特别是在 AI 与具体化系统方面。

现在我们在这里,就像在为我们机器人开发下一代 AI 模型,让它真正发挥作用。他们在这方面给予我们很大支持。我想说,到目前为止,这个系统表现是 10 分满分。我们认为它们是世界上最好的视觉语言模型,他们是全球范围内这些模型的最佳实现者。

我们目前正试图突破界限,尽可能推动这项工作在机器人领域发展。我们才刚开始这项工作,就像过去几个月一样。

Peter 我认为这对他们也有很多好处。

你提到具身 AI 。有些理论认为,除非我们能将 AI 具身化,让它们理解宇宙,并进行探索,否则我们无法实现 AGI

还有另一种观点认为,我们在实现 AGI 过程中,可能会遇到数据瓶颈,人形机器人是一种收集大量数据、帮助塑造未来模型的手段。你能谈谈这个吗?

Brett 我认为,越来越明显的是,某种程度上的输出行动,对于我们在智能方面的下一步发展至关重要。我们在这里试图做的是,帮助完成我们从一些最好的世界模型中看到的最后一步,行动与推理,我们正在内部帮助这些模型进行研究。

如果你能与机器人交谈,它能够在现实世界中执行有用的动作,这对我们在这里试图研究的世界来说,将是一项不可思议的技术。

无论你称之为高级 AI AGI ,还是其他什么,这都是我们试图达到的一个重要焦点,即如何将智能动作输出到世界中,并做一些有用的事情。

我们在 AI 方面的大部分重点,都集中在这个主题上,以及如何使其尽可能具有可扩展性与可推广性。

Peter 我必须想象, GPT-4 GPT-4 的多模态版本,对你来说是关键,能够理解这些内容。当你开始的时候,这些技术相对来说还不存在,多模态模型还不存在。这就是你与 Sam 的对话内容吗?他是否参与你内心关于未来可能发生事情的对话?

Brett 我认为,我们最大突破之一是,我们拥有大型语言模型 LLM ,更具体说是视觉语言模型 VLM ,这为我们在机器人技术领域提供语义基础。我们拥有世界上的知识,比如说,这些知识以某种方式被保存下来,类似以压缩文件的形式保存,机器人可以访问与理解。而从机器人到人类的桥梁,从未真正存在过。

如果你想与自动驾驶汽车交谈,比如说,把我放在那个路边,在右边,世界上没有真正的语义桥梁。现在,我们可以说已经有了,我们已经在世界上建造了这样的语义桥梁。

我们真正缺乏的是这种推理、规划,或许还有来自该系统的行动,以便我们在机器人中提供有用的工作。

我想说,这种令人难以置信的技术已经开放,我们现在在世界上看到许多非常酷的东西。比如,世界各地都有不同技术与 AI ,但人们很少谈论的是,这对机器人意味着什么?这意味着机器人不仅能够理解你说的每一句话,还能明白你的意思。

我们所拥有的这一切,都基于人类层面的数据,这意味着我们所掌握的所有语义世界知识都是由人类为人类编写的。对于一个看起来像人类的人形机器人来说,这是一种令人难以置信的能力,它的效率传输率非常高。

我们喜欢人类打开罐子的方式,这种方式与机器人或人形机器人打开罐子的方式非常相似,与人类工作相关的可供性水平非常高。这就像是解锁了人形机器人,真正能够像一般机器人一样解决问题的能力。

我们如何与机器人对话?如何让它们输出人类可以做到的一切动作?似乎在某个时间点,我们可以真正尝试看看是否能解决这个问题。

Peter 你意思是,我们将看到与机器人的正常互动,就像你与人说话一样。

比如你说:你能帮我拿那个吗?

它会问:你想让我拿什么?

接着你指着某个物品说:那边的东西。

它就能理解,你指的是订书机或水瓶,它具备背景知识、几何知识、位置知识。

那有多远?

Brett :今天这一切,都已经成为现实。它不仅是理解这些,还超越所有这些因素,比如神经网络权重、塑料瓶的材料、大致的质量特性与摩擦特性,它将如何抓住物体的感觉,所有这些都在它的计算中。

Peter 我致力于长寿,我想尽可能多看到这些技术的发展。

你工作多少小时?我知道你的热情,我知道你对此的奉献精神,你就像糖果店里的孩子。你还必须平衡家庭生活,你的工作周是什么样的?

Brett 我几乎每周工作七天,除了在家与妻子、孩子在一起,我几乎没有时间不工作。

Peter 你的孩子多大?他们明白你在做什么吗?

Brett 我想我们刚度过家庭日。我女儿 5 岁,儿子 2 岁。我们让机器人四处走动,所有孩子都很兴奋,这真的很酷。是的,他们明白了,他们一直在谈论爸爸建造机器人。我想,上周我们可能有 50 个孩子在这里,他们看着机器人,并触摸它们,这很特别。

Peter 我也想到了,我有 2 13 岁的儿子,我迫不及待想让他们看看你在这里建造的东西。

我认为他们的未来,与你孩子的未来将是这样,如果你的预测是正确的,我认为是正确的,机器人将比汽车更普遍。

在未来,世界上可能会有 10 亿辆汽车与 100 万辆其他类型的车辆。我们可以预见到,未来的交通工具将会发生巨大的变化。

我曾经问过一位朋友, 5 年后,当你在街上看到人形机器人行走时,会是什么样的感觉?他的回答很有趣,他说:这看起来会很正常。

Brett 如此。

我想分享一个有趣的现象,我们这里有很多人已经与机器人打交道很长时间。他们会说,每当我们做出一些新奇东西,最初大家都会感到惊讶与敬畏,很快就会习以为常,不再关心,这种情况时有发生。

在我们办公室里,最初几次看到机器人时,每个人都会停下手头工作,拿出手机拍照,甚至在会议室里挥舞着拳头庆祝。

我们有段非常疯狂的视频,视频中每个人都围着机器人,表现得非常兴奋。我第一次走进办公室时,大家都拿出手机拍照。现在,这种场景已经变得司空见惯,没人再特别在意机器人离自己有多近。我们已经习惯这些新技术,这真是令人难以置信。

Peter 我们适应新事物速度非常快,以至于它们很快就变得无聊。

我记得我第一次拿到 Model X 时,车门像翅膀一样升起,大家都在拍照、围观,很快这就成了一件平常的事,我们很快就习惯这些新奇的事物。

Brett 类似情况发生在今天使用的大型语言模型上,比如 ChatGPT 。我每周都会频繁使用它,已经将它视为我工作流程一部分。这种技术的使用,已经变得完全正常,就像是 GPT-5 的自然扩展。

至于将这些技术及其衍生产品整合在一起,或者即将揭开神秘面纱的草莓项目,我目前无可奉告。

Peter 我很好奇你对 Optimus Tesla 与马斯克的看法。我知道你非常尊重他,既作为工程师,也作为企业家,你对此有何看法?

Brett 我对马斯克在过去 20~30 年间所做的事情,感到非常鼓舞,这简直令人难以置信。我认为他们在 Optimus 项目上,做得非常好,他们有非常优秀的工程团队,已经取得显著进展,我认为他们正朝着正确方向前进。

作为一个社会,我们需要整合与制造人形机器人,他们正朝着非常好的方向迈进,我认为他们将成为我们真正竞争对手。世界需要他们这样做,我希望他们能取得成功。

我认为我们正处于关键的时间点,现在人形机器人窗口刚刚打开。 10 年前,这一切几乎是不可能的。

如今,这将是一场竞争,核心在于如何在制造方面大规模生产产品,并在具体系统上构建与部署 AI 训练集。这将是一个至关重要的时刻,真正让这一切发挥作用。

我认为他们会做得很好,我对他们正在解决的问题感到高兴。

Peter 我相信,当他进入这样一个新行业时,他将会在很大程度上证明其价值。

他们是否在帮助你们留住这支团队?当你们看到这些成果时,会不会感到惊叹,想知道他们是如何做到,或者认为你们团队更优秀?这是否为团队提供一些游戏化的激励,还是你们只是保持开放心态?

Brett 我们试图从一阶推理出发,做出所有决定,确保每一个决定都是正确的,这对每家公司来说都至关重要。

我们有自己使命、愿景、价值观,以及我们所关心的事物。这与其他任何公司都截然不同,我们希望朝着某个方向前进,类似矢量空间的方向,我们认为这是长期发展的正确方向,这就是我们在做决定时,真正立足的地方。

长远看,我们会做出一些与其他团体截然不同的事情,我们是在真空中根据我们掌握的知识做出这些决定,并经历这些过程。

我认为他们是非常强大的竞争对手,我们想赢,我们想在各个方面展开竞争,我们目标是在这里建立世界上最好的人形机器人公司。

Peter 市场几乎无限,地球上有足够空间容纳 2~3 家重要参与者。

Brett 我认为,我们需要更多真正的参与者。

特斯拉是一家真正参与者,资本雄厚,工程团队出色,长期朝着正确方向发展,快速完成高频率迭代周期与里程碑,这些都是工程团队真正证明产品具有商业可行性所必需的,我们在人形机器人领域所缺乏的正是这些。

我们有很多团队,已经在这个领域存在很长时间,但看起来不会有很多参与者能够获胜。似乎只有少数人能够跨越这个鸿沟,跨越将我们推向市场所需的鸿沟。我认为,许多人会为了跨越这个鸿沟,而付出巨大代价。

我希望我们能生存下来,现在我们还有 14 座山峰要攀登。从现在的状况,作为一家成立仅 2 年的公司,到成为具有商业可行性的真正企业,我们前面的道路非常艰难,这就是我们需要做的。

我们还有几年时间,个位数的时间来证明这一点,并进入市场,我们正在尽最大努力,将我们产品交付给客户,并使其有用。

Peter 我认为大多数人可能没有意识到,你们只有 2 年历史,以及你们组建的团队。

上一轮融资中,如果我回顾一下,如果你问普通人或普通技术专家或风险投资家,马斯克为 Optimus 带来什么优势?他在那边有一家汽车公司,可以利用它的资源;他拥有算力,也有充足资本。我认为,最近一轮融资,为你提供了平等的机会,在某些方面可能还不完全如此。

Brett 这样的论点不成立,你可以对每一家公司都这么说,质疑它们为什么不能被颠覆。你可以说,这些都是特斯拉 20 年前的弱点,当时他们还没有这些资源,一个都没有。当时已经有一些团体在制造电动汽车,特斯拉不知怎么赢了。

现实生活中的情况,并非如此简单,这些属性不能决定胜负。

Peter 我不是说它们决定胜负,我只是说这些属性是有利的。现在你有了资本,有了 OpenAI 算力,还有宝马等合作伙伴。

Brett 我认为,建立一家健康公司的所有基础都开始显现,这非常好,这些正是我们长期路线图中所需要的条件。我们只需要非常聪明的将所有这些部分组合在一起,在市场上生存下来,让产品发挥作用,生存下来是商业计划的重要组成部分。

Peter 我们可以谈谈中国吗?我觉得这个话题非常有趣。

中国在低成本劳动力支持下,取得成功,这种优势正在逐渐消失。我们经历疫情,没有人愿意继续制造产品,运输成本也在增加。

我一直在关注来自中国机器人公司,我认为出于很多原因,比如人口老龄化、独生子女政策,维持制造基地的需要,机器人将变得越来越重要。

我看到 Unitree 与其他一些公司,你觉得中国的机器人产业怎么样?有没有看起来不错的竞争对手?

Brett 几个月前,我刚从中国回来,这是我职业生涯中最好的一次访问。

我去了中国大陆一些专注于制造业的公司,那里情况简直令人难以置信。我们参观了一个工厂,我当时注意到墙上写着一些字,于是问他们那是什么。他们告诉我,那只是这栋楼的座右铭。

我继续问,上面写的是什么?他们回答说:如果你今天过得不好,就努力工作。

我当时心想,这些人简直是工作狂。他们全力以赴建造与运输,职业道德非常高尚。整个国家都充满竞争与取胜的决心,这让我感到震撼。

我去过很多次,尤其是花了很多时间参观那里的高速制造流程,真是令人震惊。

我认为,人形机器人领域,我们有一个人物,一个中国以外的乐观主义者。我认为,中国将是下一批在这一领域长期保持真正竞争力的国家之一。

Peter 我认为他们必须这样做。

我以前每年都会带一群富有的会员去中国,参观那里顶级科技公司。我记得他们座右铭是 996 ,每周工作 6 天,每天从早上 9 点到晚上 9 点。这被视为一种伟大的生活方式,也体现了他们职业道德。

中国在某些方面是抄袭者,他们抄袭很多东西,他们也进行许多真实的新开发工作,这也是我的经验。

Brett 我经验是,人都渴望成功。他们希望以最低成本、最快速度实现目标,不惜一切代价争取成为第一。这正是初创公司本质所在,你创办一家公司,并取得成功关键原则在于,你从一无所有开始,只有凭借纯粹的意志力,才能到达成功的彼岸。

中国拥有大量这样资源,他们不具备我们美国所拥有的所有资源。就像我们之前讨论的那样,拥有这些资源真的重要吗?或者说,这些资源是最终的依靠吗?

我认为中国将会涌现出一些令人难以置信的机器人公司,他们正在进行的项目数量非常庞大,我所看到的那种意愿是无与伦比的。

Peter 我认为,就像以色列为了生存,而发展出惊人的国防工业一样,人口不断减少与老龄化的中国、日本、韩国,也需要发展出令人难以置信的机器人行业,才能生存、发展,维持 GDP

Archer Public 为例,这是一个令人难以置信的成功,祝贺你。在创办与运营几年之后,你取得突破。你做出巨大承诺,投入大量资金来创办这家公司,你之所以能够做到,是你之前成功退出 Vetteri Archer

我认为,当我第一次听到你的演讲,并将其带到我风险基金时,令我印象深刻的,也是我决定投资的原因,是你组建的团队,这是一群来自顶尖 AI 与机器人公司或科技公司的非凡工程师。

你能给正在创办公司的创始人,一些建议吗?你也是一名技术型创始人,很重要,你是如何招募团队的?

Brett 我认为,为了推出一款真正优质、高质量的产品,你需要世界上最好的团队来完成这项工作。尤其是在面对困难时,成功的几率总是很低,你需要全力以赴。你需要最好团队,你需要他们每天在现场努力工作,要有高度工作热情。

我第 1 年花的时间,是在规划组织在技能方面需求,以及最终的组织结构图需要如何设计,才能支持一个真正高效的团队来打造产品。

在创业的第 1 年,我几乎是手工猎头整个团队。通过邮件与电话联系,我起草,发出录用通知书,安排共进晚餐,尝试促成合作,进行 30 60 90 天入职训练,最终让他们加入团队。我负责领导工程决策与方向,与这些团队一起开展项目。

我认为这是项巨大回报,我们现在已经取得显著进展,我相信我们拥有世界上最好的团队之一。这就像滚雪球一样,我们能够吸引到各个领域真正高素质人才。

Peter 早期阶段,你是如何获得第一批十几个人的?是你的信念吗?还是你的资本承诺?某种程度上,你面对特斯拉机器人项目,我不知道当时它是否被称为 Optimus ,而马斯克往往会用他所做的事情吸引所有注意力。你是如何说服人们离开他们原来的岗位,加入你的团队?这是一个关键问题。

Brett 早期的宣传,是我们正在研究人形机器人,肩负利用 AI 提升人类能力的重大使命。我们相信 AI 是市场的第一要务,认为垂直整合的硬件设计方法至关重要。

我们正在世界上最大的可服务市场 TAM 中工作,几乎一半的全球 GDP 都与人力劳动相关。我承诺在头几年内,为公司提供资金支持,短期内没有资金风险。

这是我第二次从 0 开始打造硬件团队,在 Archer 取得一些成功后,我们重新开始,这次在设定团队正确方向、使命、愿景、价值观方面做得更好。

我花了大量时间与人交流,鼓励他们加入我们,共同打造商业产品,从早期就建立最好的组织。

早期加入的员工,获得创始成员股份,这对他们来说非常有吸引力,他们也得到很好薪水。我自己出资,这使得这家从 0 开始的公司,在早期阶段有了资金缓冲。

随着团队逐渐壮大到 5~6 个人时,他们都是行业中超级明星,这降低了后来加入者风险。

我能够找到真正相信这个领域,并相信我的人。很多人曾经在我之前 2 家公司与我共事,也有很多新人。

我前 2 位员工是我曾经共事过的人,比如我在 Vetteri 第一位员工与 Archer 早期员工。我们 3 人在第一天就开始一起工作,随后我从 Archer 老团队吸纳一些新人,从波士顿动力与其他组织中招募一些非常优秀的人才。

在公司成立后 12 个月内,我们迅速推出自己机器人。我们非常努力,几乎是立刻就进入市场。回想起来,当时一切看似顺利,但我在 WeWork 电话亭里待了整整 5 个月,不断打电话,试图说服一些夫妻中的一方加入我们团队,并让他们说服自己配偶。这非常困难,我不会撒谎。

早期阶段,或者说在达到现在水平之前,如果问我当时是否认为我们会走到今天这步,我会说,我从未想过我们会不合适。我一直在关注产品在商业化路线图上的表现,我们当时还没有成功,甚至还没有开始发货。

我们已经存在大约 2 年多一点时间,这在某种程度上难以置信。比如,看看现在用于 AI 系统与执行这些政策的硬件数量,再看看类人机器人,这些技术的发展大概已经有 10 年,这真是令人惊叹。

我们从未在办公室里停滞不前,事情总是在向前发展。有时我们会遇到几天的停滞,比如几个机器人坏了,我们在修理它们时没有取得进展,或者没有取得很多有意义的进展,大多数时候,我们进展都相当不错。

比如,如果有人离开一周,回来后,会觉得这是家全新公司。每过一周,我们都在产生相当大影响。我想说,我们远远超出我最初对 2 年后情况的预期。

Peter 2 年前,我很好奇,你认为哪些事情看起来很难,结果却比预期容易?

Brett 没有什么是容易的,有些事情比预期要容易,也许我会从相反角度来回答。

我曾以为我们可以轻松采购到制造机器人所需的供应链,比如电子设备、电路板、电机、执行器系统、电池组系统、摄像头、灯、扬声器等。

我以为我可以去阿里或亚马逊购买这些组件,比如扬声器、屏幕、灯等,将它们直接应用到原型上,应该是非常简单的事情,事实并非如此。

即使是看似简单的组件,我们不得不制作定制的扬声器,甚至为其中一些区域编写定制的固件,这远比我最初想象的要复杂得多。这简直令人难以置信,根本不可能。

如果对这些扭矩传感器或其他传感器,进行一些简单研究,比如采购与进货,我就不必亲自去做这些事情。

我们制造扭矩传感器,比如这里有四个传感器,它们需要弯曲、电路板,还需要测量、校准与集成。上面还要搭载软件与固件,它们必须以非常高的速度工作。这一切让我感到困惑,所有这些东西都没有成熟供应链,这简直令人难以置信。

Peter 我假设这不是你第一选择,你宁愿从可靠供应商那里购买,而不是垂直整合一切。

Brett 如果某样东西容易采购,市场上有多个供应商,每个人都会选择购买。这种情况下,没有一个理智的人会想要自己建造机器人,维护它、进行质量保证、修复错误、支付人类工资,并管理人类,这需要付出巨大努力与成本,这简直是一件非常困难的事情,该死的人类。

Peter 你很快就会度过人类阶段。你认为机器人制造厂占多大比例?大致是 75% 还是 90% ?无论你选择什么指标,重量或成本,我们可能会看看其中有多少是我们自己设计的。

Brett 我不知道确切数字,我不得不认为,目前我们为机器人设计的东西中可能占 70%~80%

Peter 控制质量与从供应商那里抽取管理费用或利润,并没有什么好处。我记得我早期参观过马斯克工厂,他与一些供应商进行交谈,很多供应商都是国防航空航天供应商,价格非常昂贵。他说,去他们的,我们自己做,这就是我们态度。

Brett 我不知道我们是不是已经这样做了 2 年。

围绕制造材料与供应链的大多数工程决策都是:让我们通过将零件放入机器人中,来提高速度,让机器人进入 AI ,由 AI 工程师控制工程师,让我们完成工作。我们会很快做出这些决定,将这项工作外包,以便让机器人更快启动与运行。

长远看,我认为我们会更好控制供应链,降低风险,降低整个供应链利润率。我想我们认为这很容易,但这简直是地狱。

Peter 这件事另一面是什么?你以为会很难,最后变得容易的事情,会不会是 AI 集成?当你开始时,你有没有想过你必须建立自己的 AI 模型?

Brett 我们有很多自己的 AI 模型,可能不是很出名,我们有一个完整的 AI 团队。我们在内部进行大量工作,也与一些像 OpenAI 这样组织合作,开发新模型,并利用他们 VLM 视觉语言模型来完成一些任务,这种合作对我们非常有帮助。

我认为, AI 系统能够让人感到惊叹,它们效果非常显著。你可以想象一下,系统开发中,有多少任务需要通过硬编码方式完成,这类似更经典的控制与启发式方法。我们又能通过神经网络完成多少任务?

几年前,我想法是,系统中大部分工作,大约 90% 95% ,将通过启发式方法与代码来实现。当我们能够开发出性能相当的神经网络时,我们可以用神经网络来替代原本由代码如 C++ 实现的部分,情况有些出乎意料发生变化。如今,神经网络在各个方面都发挥着作用。

对于一个小团队来说,即使我们没有大量工具与基础设施,几乎可以立即开始使用各种技术,比如 SLAM 同步定位与地图构建、感知系统、物体检测器、规划系统、语音到语音的推理系统。这些技术在整个堆栈中,从高层到稍微低层的运行效果都非常好,我认为这真的是一种非常神奇的现象。

Peter 我记得你曾经跟我提到过,当你把解药放在杯子里,泡上一杯咖啡时,你当时的想法是,我们正在尝试进行编码。

我们让他们看别人做这件事十几次,他们就能模仿。我很好奇,你与 Figure 2 互动方式是怎样?比如,你会说:看我把这个东西拿起来放在这里,现在你也这样做。这种互动是对话式的吗?还是通过视觉模型来实现?这是一种实践的状态吗?

Brett 是的,我们就像在跟机器人说话,让它做某件事,它就去做了。

Peter 你让 Figure 2 为你做过最有趣的事情是什么?

Brett 我们现在可以与我们机器人对话,它已经能够执行任务,这真是令人难以置信。就像你真的希望默认的用户界面是语音一样,你只想通过语音与它交流。

我想,当我看起来像个孩子时,我会有另一种思考方式:我在机器人身上。我会拿出我的手机或笔记本电脑,打开终端,试图向机器人发出命令做某事。机器人站在那里听着,我感觉它只是想跟我说话。

你只想把所有这些设备都收起来,像 Figure 2 那样去做这件事。我们现在正在做这件事,这太神奇了。

人类或机器人默认用户界面将是语音,你真的希望语音到语音的推理能力变得非常高效。最终,你希望能够与机器人交谈,让它通过视觉与传感器在环境中学习,随着时间推移变得更好,它们似乎朝着这个方向前进。

Peter 我记得我们曾经认为机器人喜欢移动它们手,然后说:再做一次。是的,通过与它交谈,并向它展示你想要的东西,如果它不理解,我们可以讨论机器人安全性的问题。你的安全意识如何?你如何确保不会出现错误的固件升级,让机器人变成超能力的杀手?有足够多的反乌托邦好莱坞电影,我想把它们带到前面。你如何看待安全?这有多重要?阿西莫夫定律是如何进入你的脑海,并付诸实践?

Brett 有很多种方式,可以思考这个问题。

我们有系统安全工程方面考虑,确保机器人在设施内走动,并在人类附近工作时真正安全。这是一个整体架构,它是从上到下设计,以确保它成为安全的系统。最终,我们可以将一个安全的硬件系统投放到这个世界上,它会在各种不同的条件下,按照我们希望方式做出反应,我认为这只是问题的一部分。

就像我们需要为人类周围环境提供安全硬件一样,网络安全与其他方面的考虑同样重要。我们不希望任何人能够粗暴接触机器人,控制它们,或者对它们进行潜在恶意操作。

Peter 还有其他问题需要考虑,比如当 AGI 出现时,这对机器人安全会产生什么影响?

Brett 我认为我们在这里做了很多工作,比如在机器人上安装低级、只读的固件,确保最低级的代码不能被覆盖。这就像你知道三定律一样,更多的人可以思考如何将这些定律灌输给机器人。

如果我们现在不考虑这些问题,未来可能需要重建整个架构,这将对系统产生巨大影响。我们现在必须开始考虑所有这些因素,以便设计出更安全的系统。

Peter 现在机器人在机械上,是否已经具备足够速度与扭矩来伤害人类?很多工业机器人周围都设置防护笼等安全措施,设计上也考虑限制它们速度与力量。比如说,机器人不能跑得比你快,不能积累足够的速度来伤害你。

Brett 机器人通常重达 150 磅,无论如何,它们肯定有足够重力势能来对人类造成伤害。如果它从楼梯上掉下来砸到你,肯定会造成伤害。无论机器人是否具备扭矩感应功能,它都有可能对人类造成伤害。

我认为,如果设计不当,这个系统肯定会对人类造成伤害。或者,如果机器人出现某种故障,靠近人类,伤害到他们,这也是可能的。

从一开始,就必须非常深思熟虑设计系统的安全架构。我们还需要通过渐进式的方法,逐步验证系统的性能。

我们第一批机器人,将在工作单元中与人类隔离。如果人类进入这些工作单元,我们将关闭机器人。随着时间推移,我们将逐步推进,让机器人逐渐接近人类,最终实现合作,这将是一个渐进的过程。

至于时间框架,是 2 年还是 5 年?我不太喜欢做这样预测。我们主要关心的是在头几年内,提高系统性能与可靠性,这可能是我们面临最困难的挑战之一。

例如,你可能想看看一个机器人是否在全力工作,假设你有一个光幕,或者机器人周围有一个人工笼子。

我认为解决协作机器人与人类并肩工作的时间问题,是可以实现的,我们现在要攀登的最难的山峰,是让机器人每天完成端到端的工作而不会失败。

机器人技术发展过程中,局部故障不可避免。就像有时我可能会错过一个物体,我会重新尝试抓住它。我们可以接受局部失败,全局失败是不可接受的,我们需要确保一定的性能输出。

举个例子,假设我们进入一个仓库,仓库每天需要处理一定数量包裹,无论遇到什么样挑战,他们都必须完成任务。

如果是一群机器人在执行这些任务,他们需要达到相同性能目标。即使我们错过一个包裹,我们也必须以正确方式准时将其送达。

我想说的是,我相信我们将在这个 10 年内解决这个问题,即人形机器人能够围绕人类,并与他们密切互动。在你看到之前,你可能会先在特定区域内看到类似技术应用,就像 Waymo 在旧金山某些许可区域内测试自动驾驶技术一样。

在这些测试中,你会看到有练习司机在座位上观察一切,确保安全。类似,自动驾驶仪在高速公路上进行操作时,也会测试新的软件更新。

对于我们来说,我们现在正处于关键时期,我们需要证明机器人技术可以在有限视角下发挥作用,是有用的。

随着时间推移,我们必须建立正确的系统安全认证,以确保机器人可以在人类周围安全运行。它们需要能够在人类旁边行走,将物品交给人类,并采取某些安全预防措施,确保不会以全扭矩与全速运行,以避免对人类造成伤害。

Peter 你认为,阿西莫夫定律是否应该被纳入?

我认为这些定律非常基本,例如不要伤害人类或不要做一些可能导致人类受到伤害的事情。

Brett 这些听起来像是 AI 的基本层面,非常重要。我们需要在机器人上设置一些只读的指令,这些指令永远不能被改变,这是必须的。

Peter :拥有机器人劳动力的最大优势之一,是它们可以集体学习。当一个机器人学会一项任务时,所有机器人都可以掌握这项任务,这需要某种形式的中央控制。可能会像宝马工厂那样有一个中央控制系统,或者在全球范围内设立一个任务控制中心,监视所有机器人,并让它们学习。

Brett :我们希望机器人作为一个舰队,在共享的数据集上进行持续学习与训练。未来,地球上可能会有数百万甚至数十亿个机器人,它们将作为一个群体持续学习。我们正在对此进行离线训练,机器人将集体变得更聪明,形成一种集体智慧。

这种集体智慧的力量,类似人类学习过程,就像我的孩子们学会走路一样,他们通过不断尝试与失败来学习新事物,而不是仅仅避免错误,这需要花费大量时间。

一旦我们对某件事有深入了解,我们不会轻易忘记它。我们很少会忘记如何走路或对某些事物的喜好,这种现象在历史上屡见不鲜。大多数情况下,我们不会忘记。

对机器人来说,我们最大优势之一在于,一旦一个机器人学会某项任务,整个机器人舰队中每个机器人都会掌握这一技能。随着新事物的不断增加,机器人的学习能力将呈指数级增长,几乎像矩阵一样。

我们可以通过演示,来教机器人像人类一样学习,并通过推理来掌握如何完成某项任务。一旦机器人能够多次成功演示某项任务,我们就可以关闭这个学习循环,确保其有效性。这一过程,还包括一个奖励系统,确保舰队中每个机器人都能掌握新技能。

Peter 我认为未来外科手术,将由机器人来完成。当机器人经历数百万次不同手术后,它们将成为最优秀、最可靠的外科医生。

我们可以结束这个话题,稍微谈谈工作问题吗?我不得不考虑到,人们担心机器人会抢走他们工作。

Brett 目前为止,我们收到非常积极反馈,我们目标是能够完成许多人类不愿意做的工作。你之前在播客中提到,我们有大约 800 万个工作岗位,是人们不愿意从事的。我们希望机器人能够承担这些工作,尤其是对人类来说,可能有害或危险的工作。

许多这样的工作,都有很高失业率与极低留存率,我们希望通过自动化来解决这些问题。作为一个世界,我们已经在几个世纪以来逐步实现自动化。我的家人是农民,曾经有一半世界人口都是农民。我在农场长大,当时世界上 80% 人口都是农民。如今,只有 1% 的人口从事农业,数量已经大幅减少。

我是在农场长大,没有人会因为我们不再务农而感到愤怒。你明白我的意思吗?就像现在, 80% 人口不再务农,这不是一件坏事。对于曾经耕田、收割玉米与大豆的人来说,这种转变是必要的,我不认为让 2024 年的人类回到那种状态会是富有成效的。

Peter 你记得福岛核反应堆事故吗?当时 DARPA 举办机器人挑战赛。你有没有看过视频?当时机器人无法完成简单任务,比如打开门或爬楼梯,场面简直令人发笑。我认为,国防部与政府是否是我们客户或潜在客户,这是一个值得探讨的问题。

你对融入那个世界,有什么感觉?

Brett 我们根本不会涉足任何与国防相关业务。就像 Intermedia Festo 在线一样,我们认为民用市场规模要比国防市场大得多。我们不想制造任何类型战争机器,无论是动能、还是非动能的。我们甚至不会与这个领域的人进行对话,也不会接听他们电话。

Peter 你对民警与安全领域有什么看法?

Brett 目前,我们不会触及这些领域。我们不想参与任何可能导致机器人对人类造成伤害的项目,我们目标是推动工作发展。

我们认为,机器人技术可以极大促进经济发展,降低商品与服务成本,为世界带来积极影响,我认为这是非常必要的,我们现在将所有精力都集中在这个方向。

Peter 你接下来会关注哪些行业?你可以涉足每个行业,你认为你会在哪些领域重点发展?

Brett 我们会一步一步来。我们正在谈论的这些公司规模都非常庞大,我们可以向这些团体提供数千台机器人。

对我们来说,现在宁愿只与少数几个团体合作,确保做得非常好,而不是一下向数百个团体开放市场。

未来几年内,我们会将产品销售给更多客户。我们计划 2025 年开始我们生产线,我们会从几个客户开始合作。我们工程团队会与这些客户紧密合作,确保产品运行良好。

我们需要修复很多错误,进行流程改进,确保这些产品在市场上表现出色。随着产品成熟度提高,我们将逐步拓展到更多客户,花费越来越多时间在家用机器人上。

Peter 我什么时候,可以在家里拥有一台机器人?我现在就想下订单。

Brett 6 个月,我都会与团队讨论,我们进入家庭市场的时间表正在加快。

我们在劳动力市场的成功,对我们进入家庭市场非常有帮助,它能帮助我们提高系统的可靠性与安全性,降低成本,增加制造量,这些因素将有助于我们进入家庭市场。

你可能会看到,从劳动力市场到家庭市场,价格会大幅下降。要实现这一点,我们需要规模经济,需要一个经过安全认证的家庭系统。

我们正在通过多种方式,利用劳动力市场的经验,来实现这一愿景。绩效角度看,我认为我们将逐步在家庭中开展早期工作。家庭是一个重要领域,我预计每 6 个月就会有显著进展。

如果要我预测时间,我认为未来 3 年内,我们肯定会实现机器人在家庭中应用。

我愿意尽早参与测试,甚至愿意为此付费。我们可能会从我们设施中一些模拟家庭开始,逐步解决问题,了解如何让系统架构全面运作。我特别感兴趣的是,看看我们会遇到哪些我们尚未准备好的问题,这些问题可能会限制我们长期居住的能力。

Peter 关于制造与扩展规模,你正在为 Figure 建造一个制造工厂吗?

Brett 是的,我们计划 2025 年开始生产线建设。我们打算在加利福尼亚进行这项工作,靠近工程团队,以便更好解决问题,这将类似传统试点生产线或生产线的模式。

我们会逐步宣布我们的高速率制造计划,将在哪里展开。目前,我们正在设计生产线,计划 2025 年让机器人上线生产。我们会根据预期的产量来调整规模,初期可能会从几百台机器人开始,逐步增加到几千台。

对我们来说,比拥有 3,000 4,000 5,000 台机器人更重要的是,真正掌握如何高效进行生产,确保我们生产机器人运行良好。

我们必须避免出现大量机器人运行不良的情况,否则我们将陷入不断修复问题的循环中,这不仅降低产量,也没有真正帮助。

我们需要在生产的某个阶段,确保系统可靠性达到很高水平,确保这些机器人性能能够满足实际用例需求。

制造数千个机器人不容易,制造数十万甚至数百万个机器人是另一个层次挑战。

制造 2,000 5,000 1,0000 个机器人,在当前阶段是可行的。我们可能会从每周制造一个开始,逐步增加到每天制造一个,接着在接下来 12 个月,我们开始每天制造多个机器人。

这条道路看起来相对简单。我们几乎是手工制作手机,每年生产数十亿台。机器人比手机更复杂,远没有汽车复杂。我认为在短期内制造数千个机器人的目标,不是非常困难。困难的部分在于,如何让这些数千美元真正发挥作用,真正变得有用。对我来说,这就是游戏的核心。

Peter 我是你超级粉丝。我非常期待你所建造的一切,尤其是 Figure 2 推出。我还看到 Figure 3 ,真的非常漂亮,我对此感到非常兴奋。

感谢你所做的所有努力,我认为这是提升人类与创造富足时代的一种方式,非常感谢。

对话宇树创始人王兴兴:做机器人,中国缺乏 AI 人才
时间: 2024 8 23

来源: 腾讯科技

字数: 9,873

2024 年不少厂商开始将人形机器人搬到工厂打工,优必选透露正与东风柳汽、一汽大众青岛有合作,马斯克让擎天柱在特斯拉工厂自己造自己,宝马集团斯帕坦堡工厂使用 Figure 测试机器人在工厂的应用。逛一圈世界机器人大会之后发现,人形机器人距离成为真正的打工人,还有不小一段距离。

它们没有展现出能够替代人类劳动力的能力,有的人形机器人行走都比较困难,需要在吊杆辅助下才能顺利挪步,有的人形机器人能够演示检修作业能力,例如,对轮胎进行质检,但实际汽车工厂场景更复杂、工序流程更多。

单纯轮胎质检环节,有成本更低、有视觉感知功能的设备就能完成,不需要成本更高的人形机器人。

诸如车辆内外饰装饰、道路测试等,更复杂、更耗人力的场景,机器人泛化能力不够,尚无法代替人类。

与其说机器人们进厂打工,不如说他们是进厂学习。目前,机器人企业们需要进入工厂不断完善数据采集工作,来帮助提升产品泛化能力。

世界机器人大会之前,王兴兴分享他对人形机器人产业现状的观点,他认为, AI 能力不够,是机器人行业发展最大瓶颈。只有机器人 AI 能力能突破一个临界点,工厂里一些工序才能跑起来,机器人才能比人效率更高,中国的 AI 人才欠缺,对 AI 人才培养力度不够,王兴兴认为跟通用 AI 发展相比,机器人 AI 的整个行业,落后 10 年左右。

硬件层面也会对机器人发展形成桎梏,王兴兴认为硬件没有理论上门槛,它是工程上问题,在工程上把成本做得更低,做得更好,外观做得更加极致,硬件功能更加丰富。

整个机器人行业发展还处于探索阶段,各家机器人公司技术方案不统一,比如机器人应该有几根手指,到现在也没有统一答案,有的做 3 根手指,有的 5 根,客户意见也没有达成一致,有些客户喜欢 2 个手指,有些客户喜欢 5 个手指。

机器人行业存在软硬件困境,王兴兴表示行业会越来越好,这个行业越来越热,有更多聪明人,更多钱,更多关注参与进来。

腾讯科技整理王兴兴现场 QA 实录,有部分删减。

AI 能力不够,限制机器人发展

Q :今天向机器人疯狂涌来的关注,背后都带着 AI 带来机器人进步的判断,忽视机器人本身技术进步,今天宇树在机械与动力等方面重要突破有哪些?

王兴兴:目前这波机器人浪潮,主要源于 AI 浪潮推动。大语言模型的出现,使信息领域取得显著进展,实现对话与语音交互。要真正释放 AI 潜力,还需要物理机器人来执行实际任务,这引发人们对机器人发展的更高期望。

现阶段,我认为机器人行业最大限制在于 AI 的不充分,无论是 AI 模型、训练数据集,还是场景的部署,都远远不够。机器人的发展瓶颈在于通用 AI 模型,全球范围内还没有突破临界点,这是主要障碍。

硬件层面也存在不足,但没有理论上门槛,主要是降低成本、优化设计、增强功能等工程问题,解决这些技术问题的时间是可以预估的。我们可以说,如果某天有人研发出 AI 机器人模型,并找到我们定制机器人,我们可以保证年底前交付 10 万台人形机器人。

硬件还需要改进,例如提升电机扭矩、延长减速器寿命、提高负载能力、增强操作精度、提升视觉感知分辨率与加快执行速度,硬件并非最大限制。

很多人认为我们是一家硬件公司,我对此表示认可,这意味着我们硬件得到大家认可。

例如,我们机器狗在全球出货量一直不错,我们在硬件上整合一些软件功能。 2023 年推出的 Go2 机器狗,集成 OpenAI 大语言模型接口,实现对话,并通过服务器反馈结果来执行预设功能,如前进、拍照等。

我们还整合 OpenAI 多模态接口,使机器狗能识别周围环境。运动控制的强化学习部分,也是我们自行开发。

我们在 AI 方面也做了不少工作,相比一些纯 AI 公司,我们投入较少。

我们公司希望能不断提升产品,在工厂、服务业、家用等场景中产生真正价值。无论客户将我们视为硬件还是软件公司,我认为都无关紧要。

Q :很多具身智能公司,总是把宇树形容成做人形机器人的身子,而他们将自己定位为是在做大脑,你认可这样说法吗?

王兴兴: 过去 1 年,我们销售不少产品,更希望有更多客户使用我们机器人。即使他们只购买硬件、删除所有软件,也没问题。

我们曾与一些 AI 公司合作,也自行开发部分 AI 系统,如果我们不做 AI ,无法展示机器人 AI 的实际效果。

我们总要提供一个初始软件系统,就像手机自带的软件,用户可以自行选择是否保留或更换。硬件始终是为 AI 服务,我们致力提升 AI 性能。公司对 AI 投入相对克制,成本高昂。

机器人本体是我们核心业务,我们会继续专注这方面,欢迎与大模型公司合作。如果他们 AI 表现出色,我们愿意将其直接整合到我们产品中。我们欢迎其他公司的优秀软件取代我们的,直接面向终端客户。

我认为最近 1~2 年的 AI 与机器人浪潮,与过去几十年完全不同,技术、社会认可度、资本热度,都不可同日而语。如今,机器人与 AI 已成为全球共识,受到各国大公司、央企与地方政府高度关注,这与过去几十年情况大相径庭。

目前的机器人 AI ,仍未达到令人满意水平,只能执行一些固定任务。我的发言权有限,我认为机器人 AI 的发展,滞后通用 AI 10 年。

我相信这种情况会有所改善,原因很简单:行业变得越来越热门,有更多聪明人、资金、关注涌入,这将推动行业加速发展。

早期,纯 AI 门槛较低,行业内有大量从事纯 AI 与传统 AI 的人,比从事机器人 AI 的人多出数百倍,导致该领域发展较快。

过去 1~2 年里,机器人 AI 行业迅速升温,吸引更多人参与,这也解释为什么我认为未来机器人发展速度会加快。如果继续按照过去速度发展,可能需要十几年、甚至 20 年,才能见到显著进展。

Q :你对未来机器人真的能帮助人干活这件事情,有没有什么具体期待?让机器人真的能干活或者更像人,需要从软件 AI 大脑这块,还是在机械力度这块发力?

王兴兴: 干活分为多个阶段。

目前的 AI ,如模仿学习,可以完成一些特定任务。例如,固定工位的操作,如特斯拉前段时间展示的电池分拣技术,现在全球多家公司都能做到,成功率接近 100%

这类任务,基于固定工位的工序,通过大量数据训练实现。一旦任务发生变化,就需要新的数据进行训练。这样的操作已经可以实现,具备初步商业化潜力,商业价值不大,任务相对简单。

未来,希望 AI 能在工厂中执行更复杂任务,例如更好组装或拆卸零部件,或在农业中完成复杂操作,而不仅限于简单抓取动作。

我认为,这类任务在未来 1~2 年内有望实现。进一步的目标,是实现真正通用性。例如,给机器人看一张照片或简单描述,它就能组装产品或整理桌子,即使从未见过该物品;或者,将机器人带到陌生的家庭环境,它能够整理房间,完成洗衣做饭等任务,这是更高层次的目标。

AI 软件仍是关键,当前主要瓶颈在于 AI 软件,即使硬件再先进,若 AI 软件未能突破,依然无法实现真正进步,否则只会回归传统自动化领域。

当前自动化工厂中,机械臂已被广泛应用。我认为,新的机器人公司,应避免变成传统自动化公司。如果 AI 尚未突破,就会依赖传统自动化技术,这并非最终目标。

大家的期望,是通过 AI 实现传统机器人无法完成的更复杂任务,这样才更有价值。否则,与自动化行业竞争效率,人形机器人无法胜出,自动化设备往往能在 1 秒内完成数十次操作。人形机器人应专注更复杂、传统自动化无法完成的任务,这才更有意义。

Q :在人形机器人领域,是不是不太存在的一种可能性,就是大力出奇迹,现在大模型领域很信仰一种东西,就是堆算力,用更多的数据把模型训练更精确也好,大语言模型训练更精确,在人形机器人领域,是不是不存在这样一种基本逻辑,就是投入大量数据与算力,把它的通用模型搞得更好?

王兴兴: 对于一家财力与人力雄厚的大公司,我建议可以多投入一些资源。对我们公司来说,这样的策略可能不太适合,我们需要谨慎考虑成本,采取相对保守策略。

最大问题在于,目前国内大公司对 AI 与机器人领域高度关注,投入相对克制。团队规模大者可能有几百人,小者可能只有几十人,整体投入相对有限。

主要原因在于,当前 AI 模型,尤其是机器人模型,没有像大语言模型那样明确技术路线。在模型尚未清晰的阶段,投入大量财力与人力可能效果不佳。这种情况下,贸然投入,就像在不明道路上狂奔,结果未必理想。

OpenAI 当初大规模投入的前提是,他们已经内部验证模型可行性。 ChatGPT 模型,在加大算力与资源后,效果显著,这才推动高投入。机器人领域,目前很难明确哪个方向是绝对正确。

目前相对公认的方向,如模仿学习,特斯拉正在探索。通过堆积数据来提高模型表现,例如为不同任务积累数据,这些任务最终都能完成。这种方法有效,但更大范围的验证尚不确定。或许特斯拉内部已经做了验证,外界尚不知情。

总之,目前无人能确定哪个模型绝对正确,仍存在很大不确定性。

Q :具身智能在过去 1 年中,与大语言模型一样受到市场高度关注,你判断通用机器人领域什么时候会出现 iPhone 时刻? AI 大模型为机器人领域,带来哪些明显能力提升,目前还存在哪些挑战?

王兴兴: 我认为 iPhone 时刻,是一个非常关键的时间节点,我们离这个时刻还有距离。 iPhone 时刻的出现,并非源于单一技术突破,而是多项技术的综合突破。

触摸屏、强大的 CPU 、图形界面早已存在,乔布斯提出终极产品构想,将这些技术整合在一起。

具身智能或机器人 AI 领域,我保持乐观。目前机器人显得笨拙,只能执行固定任务,我相信进展在即。

2024 年初,我曾预测,到年底,全球至少会有一家公司或实验室,开发出通用型机器人 AI 模型。这个节点,或许还不能被视为 AI 领域 iPhone 时刻。

我们期待的是工业或服务业中,出现真正的终端产品,标志性推动行业爆发式增长。我认为这样的 iPhone 时刻,可能还需要 3~4 年,但不会超过 5 年。

AI 领域的进步,往往是阶梯性,就像 ChatGPT 的出现一样。在它问世之前,大多数人认为大语言模型能力有限, ChatGPT 的出现,改变这一看法。这种突飞猛进的进步,在机器人的 AI 领域,同样至关重要。

硬件的触觉系统不好做,最大问题是太容易坏

Q :你之前在具身智能大会的时候,有提到过会考虑会在机器人上增加足够多触觉感知,你认为现在触觉重要性在哪里?瓶颈又是什么?

王兴兴:触觉对于生物与智能体至关重要,如果一个人的皮肤失去触觉,会严重影响日常生活,可能无法抓住物体或在走路时失去平衡。

例如,将胶带贴在猫的身体上,猫会表现出奇怪的动作,这表明触觉对哺乳动物的重要性。

目前触觉技术非常落后,许多机械臂基本没有触觉功能。正在努力为机械臂配备触觉传感器,以更好操作物体,例如防止滑落或抓坏物体,触觉传感器的重要性毋庸置疑,全球都在朝这个方向努力,包括特斯拉在内的公司,已经在手指上安装触觉传感器。

触觉传感器非常难以制造。首先,它们需要非常小、高度敏感,需要大量排列,这样才能确保与物体频繁接触时不会损坏,最大问题是它们太容易损坏。

如果在皮肤上部署数百、甚至数千个触觉传感器,磕碰时,损坏概率非常高。灵敏度与易损性之间,存在矛盾。

以工业机器人中的六轴力传感器为例,很多行业不愿使用六维力传感器,主要原因是它们易损坏。

高敏感度与防护之间的矛盾,使得这些传感器容易在磕碰后出现问题,例如零点漂移。原本应输出 1N · m 的力,磕碰后可能变为 10N · m ,这种问题相当普遍。

触觉技术的主要瓶颈,在于可靠性。我们公司或我个人,一直在寻找一种简洁、可靠的方案来实现优良的触觉感知,而不是过于复杂的数据处理,这样才能实现量产。如果全身有 1,000 个触点,保证量产的质量,将是一项非常艰巨的任务。

Q :机器人的避障系统,与自动驾驶有相似之处,包括激光雷达与毫米波雷达的应用。现在自动驾驶技术发展迅速,它对机器人技术的推进有促进作用吗?

王兴兴: 会有一些促进作用,大多数传统的自动驾驶技术依赖传统的数学方法。在工业场景中,如工厂内使用 AGV 进行搬运或园区内巡逻,这些技术已经足够。

目前大家更希望能实现类似 FSD 的端到端自动导航技术,在人形机器人应用上,包括特斯拉在内的企业,都进展缓慢,特斯拉大部分人力资源都集中在 FSD 上。

人形机器人的 AI 投入相对较少,进展不如预期快速。即使在国内,专注类似 FSD 的自动驾驶技术,并应用于机器人领域的公司很少,有一些创业公司在探索这一领域,但整体数量有限。

机器人有不同流派,没有统一的技术路线

Q :从目前人形机器人研发角度看,大模型可重点解决哪些技术问题?主要应用在哪些方向?大模型与 AI 的应用,有望降低研发成本吗?

王兴兴: 目前提到大模型,通常指的是大语言模型或多模态模型,这些技术可以应用于机器人。例如, 2023 年我们结合 OpenAI 大语言模型接口。

真正的机器人大模型发展下去,单纯的大语言模型不够。大语言模型,可能是机器人模型的一部分,它不是全部。

举个例子,在工厂里工作的机器人,可以不说话,只需接受任务并执行,如通过图像或数字指令完成工作,不需要语言交互。

对于机器人或具身智能,关键在于执行任务。这包括在工厂里拧螺丝钉,或在家里洗衣做饭,核心是机器人能有效完成任务,而不是进行对话。

如果只是对话,一个手机就能胜任。任务执行能力,是最重要的。在这一点上,大语言模型的技术只占一部分,更多是要构建适用于机器人的模型。例如,整合图像、机器人关节指令、激光雷达数据等。

最近特斯拉在招聘数据采集工人,以便进行训练,这种训练与大语言模型关系不大,更偏向模仿学习,模型结构也与大语言模型不同,这是目前已明确的发展方向。

机器人具身智能领域的体系尚未成熟,不像大语言模型有清晰的框架与数据对齐方法。各家公司,在技术路线与共性上存在很大差异,例如相机的配置、传感器的使用、是否采用触觉传感器等。

不同流派有不同观点,有的流派甚至不使用灵巧手,仅使用爪子;有的希望手指更加灵活,配备丰富的传感器。 AI 模型的技术路线尚不统一,很难判断哪条路线是正确的,哪个模型已达到何种进展。

这种情况,类似 ChatGPT 模型出现前的语言模型领域,当时有许多不同的模型结构,最终 GPT 架构被证明更有价值,淘汰其他模型。

目前,人形机器人具身智能领域正处于类似阶段,各方都在探索,没有人能确定哪条路线绝对正确。

Q :宇树与波士顿动力电动 Atlas ,都采用的是三指,可以详细介绍一下为什么三指就刚刚够用,而不是两指或者四指?电动 Atlas 头部参照的是皮克斯的灯,宇树 G1 的头部还会有什么新设计?

王兴兴: 这个问题很有意思。

全球智能或人形机器人的技术方案不统一,例如手指数量。有人喜欢两指,我们有三指与五指设计。客户喜好也不同,有的喜欢两指,有的喜欢五指。技术统一性并不大,但 Atlas 与我们公司 G1 都采用三指。

对我们公司来说,原因很简单。 G1 较小,约 1.3 米,五指手会显得过大。我们发现三指足以应付大部分任务,如抓取物品。百分之九十几的操作,三指就够用。

波士顿动力的 Atlas ,在工厂里也用三指。实用性角度,希望硬件越简单越好,避免五指多关节出现问题,一个或两个关节就能实现功能。

使用角度看,机器人手指越简单越好。一个电机的关节手指,两指可能已足够。对于更精细的任务,如焊接或使用筷子,两指或一个关节手指难以实现,三指基本够用。

随着 AI 技术成熟,对硬件需求越来越低。例如,残疾人朋友即使没有手掌,也能做精细的事情。

随着 AI 技术进步,对硬件要求会降低。未来,当 AI 足够领先时,从垃圾堆里找几个关节电机与木头拼凑成人形机器人,它就能自己走路甚至干活,硬件要求会越来越低。至于头部设计,我们目前的设计令人满意,短时间内可能不会改变。

G1 机器人定价 9.9 万,再便宜对行业不好

Q :成本这个问题, G1 价格,市场反应还是蛮大,我们通过自研,为什么能够做到这么大幅度降本?以及现在很多公司的观点,是觉得说现阶段可能降本不是最重要的事情,随着供应链进步,请具体讲一讲降本这件事?

王兴兴: 我们一直寻求更合理的架构,以提供产品给客户。产品价格要相对友好,否则购买者会减少。推动整个行业进步,需要良好的硬件本体,吸引更多人参与。

四足机器人行业发展得好,得益于整个行业共同努力。我们希望更多人使用我们产品,即使功能有限,价格也要具有竞争力。

我们在四足机器人方面积累丰富经验,如关节电机生产、整体机械结构、传感器与电控系统芯片等。

目前,我们机器狗价格,最低 9,000 多人民币,人形机器人相对较贵。如果价格过低,可能对公司与整个行业都不利。我们希望价格合理,随着后续出货量提升与机器人能力增强,价格可以有更好调整。

降低成本的原因很多,包括零部件设计、生产与管理。

我们公司已有 8 年历史,有多款产品量产经验,量产仍然具有压力。每个零部件都要细致设置,有些精度要求高达 0.01 毫米,零部件配合、螺丝与工艺要求都要考虑。

供应商提供的零部件,要满足质量要求,管理方面的要求也很高。大量生产可以降低成本,这是公认的事实。

在设计阶段,就要为降低成本做准备,简化零部件,降低材料成本,或者用一个零部件替代两个。

汽车行业也是如此,比如比亚迪在新能源汽车领域,成本管控与利润方面表现优异。通过比较拆车拆机的视频,可以了解他们是如何降低成本,这是值得学习的地方。

Q G1 目前最主要的几个客户种类是怎样的?

王兴兴: G1 目前客户类型较为复杂,包括个人客户、科研院所、 AI 公司、科技公司,以及一些工厂项目,基本达到预期。

Q :我发现 2024 年,国内外人很多形机器人宣布进厂打工,大多不具备一个实际操作,但已经进入到工厂内训练能力,你怎么看这个现象?

王兴兴: 马斯克最早提出让汽车工厂使用机器人,目前汽车工厂对此颇感兴趣。我们与蔚来汽车工厂合作,部署人形机器人进行现场搬运。其他国内人形机器人,也与汽车工厂合作。

目前尚处于试点阶段,大家认为这个方向有价值,并共同推进。尚未达到真正商业闭环,即机器人产生的商业价值降低成本。

我们公司主要销售机器人本体,不仅限于工业,也欢迎科研教育、 AI 公司与个人购买。我们也在推进工业领域应用,如生产装配与简单搬运。

蔚来汽车工厂合作是一个典型例子,还有其他项目合作正在推进。推进速度与效率可能较慢,我们对行业有耐心,没有给自己设定紧迫目标。我们尊重市场反应,当技术与产品达到一定程度,具备商业推广势头时,再进行大规模推广。

Q :现在机器人都还在投入期,你有没有预估或者是预判什么时候能到盈亏平衡,什么时候能到市场爆发阶段?

王兴兴: 盈亏平衡取决于计算方式,我们公司保留合理利润,更关注机器人出货量与使用人数。

AI 投入与盈亏平衡关系密切,大量投入 AI 与人力,可能导致难以盈亏平衡或严重亏损, AI 成本较高。

每家公司情况不同, AI 投入少,可能更容易实现盈亏平衡。市场爆发时间点,可能在 2025 年。如果 2025 年实现商业闭环,即机器人价格与产生的商业价值呈正相关, 2025 年底 ~2026 年,可在工厂大规模铺开。一旦工厂设备产生正向商业价值,许多工厂会购买,这是不可阻挡的,产生正向商业价值最重要。

Q :人形机器人鼻祖 Atlas






请到「今天看啥」查看全文