本文转自微信公众号“硬AI”,作者:硬AI。
人形机器人正在快速发展,但整体技术仍未达到工业或消费领域大规模应用的要求。高盛认为,人形机器人技术的拐点可能会出现在三个方面:解决多个通用任务、高成功率和持续稳健性、快速推理。目前,人形机器人的发展仍然存在一些障碍,比如缺乏训练所需的原始数据。
作者
|蒋紫涵
编辑
| 硬 AI
近日,特斯拉Optimus的现场演示以及宇树Unitree H1的春晚首秀,都展示了人形机器人的进步,但整体技术仍未达到工业或消费领域大规模应用的要求,主要受限于通用和自主AI能力不足。
2月20日,高盛分析师Jacqueline Du、Yuichiro Isayama等人发布研报称,
人形机器人技术的拐点可能会出现在三个方面:解决多个通用任务、
高成功率和持续稳健性、
快速推理。
高盛还指出,
近年来,人形机器人制造商数量快速增长,这一行业可能已经接近进入量产阶段,此外,英伟达推出的物理AI研发生态系统也是推动人形机器人技术发展的另一个关键因素。
在2024年3月的GTC大会上,英伟达推出了边缘计算SoC Jetson Thor、GR00T模型,以及Isaac平台。Jetson Thor是人形机器人所需的高性能硬件,能够让机器人自主运行预训练的边缘AI模型;Isaac是一个集成了多种工具的研发平台,生成了英伟达内部的通用模型GR00T。
但是,高盛也指出,
目前人形机器人的发展仍然存在一些障碍,比如缺乏训练所需的原始数据。
与大语言模型(LLMs)类似,机器人AI模型也需要大量数据来支持模型训练和优化;但与LLMs的视频、图像、文本数据不同,机器人AI模型所需的重要物理数据(如力、扭矩、运动数据)仍然稀缺。
因此,弥补原始物理数据的短缺已成为促进机器人AI研发的共识需求,鉴于这一需求,多家企业纷纷做出响应。例如,英伟达推出的Isaac GR00T Blueprint和Cosmos框架能够利用合成数据加速模型训练,弥补这一不足。
通用性是人形机器人与传统工业机器人之间的关键区别:传统工业机器人通常被设计用于完成特定任务,如装配线上的单一操作;相比之下,人形机器人需要具备处理多种任务的能力,比如在家庭、办公室或工业环境中执行不同的工作。
因此,
高盛认为人形机器人至少需要在多个(例如5到10个)通用任务上表现出色,才能开始大规模应用。
这里的通用任务包括但不限于搬运物品、清扫、提供服务(如引导、语音识别)、数据采集、以及与人类的互动等。这种通用性是人形机器人实现大规模应用的关键,因为它能使机器人适应更加多样化的工作环境和需求,而不仅仅局限于特定领域。