Figure AI把「终结者」造出来了

AI生成未来 · 公众号 · · 2024-08-07 00:18

正文

点击下方 卡片 ，关注“ AI生成未来 ”

>>后台回复“GAI”，免费获取AI行业报告和资料！

转载自：机器之心

如有侵权，联系删稿

能语音对话，VLM 视觉，每天工作 20 小时。

总会有这一天，但我们没想到来的居然这么快。

北京时间 8 月 6 日晚，硅谷著名具身智能创业公司 Figure 正式发布了自己的新一代人形机器人 Figure 02。

除了样子够科幻，这种机器人也有着足够通用的智能，它可以与人类实时对话，自动学习如何装配零件。事实上，Figure 02 正在宝马位于 Spartanburg 的工厂实习工作，我们仿佛已经进入了未来。

Figure 工程和设计团队完成了对 Figure 02 硬件和软件的彻底重新设计。在人工智能、视觉、电池、电子设备、传感器和执行器等关键技术上均取得了重大进步。

具体来说，Figure 02 主要包括以下特点：

实时语音对话 ：Figure 02 能够通过连接到定制 OpenAI 大模型的内置麦克风和扬声器与人对话；
摄像头 ：由 6 个 RGB 摄像头驱动的 AI 视觉系统；
机械手 ：具有 16 个自由度和与人类同等力量的第四代机械手；
内置 VLM ：支持机器人摄像头进行快速常识性视觉推理；
大容量电池 ：机器人躯干中的 2.25 KWh 定制电池组可提供 50% 以上的电量；
CPU/GPU ：与上一代相比，机载计算和 AI 推理能力提高了 3 倍。

全面改进：通用 + 人形 + 实用化

这回升级，最大的变化可能是 Figure 02 真的准备好回应语音指令了。

去年那支惊艳科技圈 demo 里，站在 Figure 01 前的人类向这位机器人提问：「可以拿点东西给我吃吗？」它不仅识别出面前的物体是苹果，它更懂得苹果可以直接食用，于是它把苹果递给了面前的人，说道：「当然，拿去吃吧。」

今年 3 月，OpenAI 宣布与 Figure 合作开发具身智能，让人形机器人拥有了实时有效的对话能力。背靠 OpenAI，Figure 能够快速迭代机器人语音到语音的能力。Figure 表示，由于 Figure 02 的端侧算力大幅提升，已经可以完全自主地在现实世界中执行各种任务。

在 Figure 02 上，机器人语音推理的实现主要得益于内置的麦克风和扬声器连接到与 OpenAI 合作训练的定制 AI 模型上。

Figure 02 的导航系统使用了 VLM（视觉语言模型），这使得机器人上的摄像头能够进行语义基础研究和快速常识性视觉推理。VLM 是当前众多造车新势力正在研究的智能驾驶新方向，在机器人领域，这种方法显然也可以在很多任务上实现突破性的效果。

续航能力可以说是人形机器人实用化面临的最大挑战之一。Figure 02 机器人躯干内定制有容量为 2.25 KWh 的电池组，可以比 Figure 01 多提供 50% 以上的能量，从而最大程度地延长机器人的运行时间。Figure AI 的创始人、CEO Brett Adcock 表示，他们希望 Figure 02 每天能够实现约 20 小时以上的有效工作。

我们可以看到，Figure 02 的外观变得更加具有整体性，这是因为它采用了全新的外骨骼结构。相比于 Figure 01，机器人的外形设计转变较为彻底。另外它也采用了集成布线的设计。集成布线具有以下好处：

可靠性更高
隐藏电线
更紧密的封装

从 Figure 01 到 Figure 02，外形上有很大改观。

Figure AI把「终结者」造出来了

正文

请到「今天看啥」查看全文