英伟达高级研究科学家Jim Fan称:“网上看到的大多数机器人演示都会加速视频。我们实际上放慢了速度,这样你就可以观测人形机器人流畅的运动。”在他看来,2030年人形机器人奥运会必然是一场盛事。
论文指出,人形机器人可以实现类似人类的全身技能,但由于模拟和现实世界之间的动力学不匹配,实现敏捷和协调的全身运动仍然是一个重大挑战。现有的方法,如系统识别(SysID)和域随机化(DR)方法,通常依赖于劳动密集型的参数调整,或者要牺牲敏捷性,策略过于保守。
因此,研究团队提出了ASAP,这是一个两阶段框架,旨在解决动力学失配问题,并实现敏捷的人形全身技能。
“我们的解决方案很简单。”Jim Fan表示,ASAP采用了“真实-仿真-真实”方法,只需在实体机器人上部署一个预训练的策略,收集数据,并在仿真环境回放动作。虽然回放过程必然产生偏差,但这会产生关键的数据源,来修补物理差异。通过额外神经网络学习差异参数,实质是对传统物理引擎进行“动态校准”,让机器人能基于GPU的并行计算能力,在仿真环境中获得近乎真实的大规模训练体验。
论文共同作者Guanya Shi称,ASAP框架分为两个阶段:第一阶段,预训练一个基于相位的动作跟踪策略,以在仿真中模仿人类动作;第二阶段,在现实世界中推出该策略以收集数据,学习一个残差动作模型来补偿动力学不匹配,最后用学习到的残差模型对预训练策略进行微调。
Guanya Shi补充道,ASAP不仅适用于仿真到现实的迁移,它还提供了一个通用框架来对齐训练和部署环境中的物理特性。
在人形机器人领域,英伟达雄心勃勃。在2025国际消费电子展(CES)上,英伟达创始人、CEO黄仁勋表示:“机器人技术的ChatGPT时刻即将到来。与大型语言模型一样,世界基础模型对于推进机器人和自动驾驶汽车开发至关重要,开放世界基础模型加速下一波AI浪潮。”
根据英伟达的规划,该公司并不打算与特斯拉等机器人制造商展开直接竞争,而是要为这些制造商提供一种“底层代工业务”。该公司预计于2025年上半年推出用于人形机器人的紧凑型计算机Jetson Thor,Jetson Thor基于英伟达Blackwell架构搭建,在AI性能方面可提供每秒800万亿次8位浮点运算,能够运行支持人形机器人的多模态AI模型。
中国企业,则是英伟达机器人业务最有潜力的市场之一。英伟达在1月15日举办的“答谢迎春会”晚宴上,邀请了多家人形机器人本体厂商高管参加,银河通用创始人王鹤、宇树科技CEO王兴兴与黄仁勋同席而坐。
值得一提的是,英伟达机器人技术业务副总裁Deepu Talla一行近日到访了国家地方共建具身智能机器人创新中心。Deepu Talla表示,将在2025年推动双方进一步深化合作。在长达两小时的深度座谈中,创新中心与英伟达就世界模型、数据生成、高精度先进仿真器和机器人全身控制等方向进行了深入讨论,并规划了相关合作事宜。