主要观点总结
本文解读了英伟达CEO黄仁勋在CES 2025上的主题演讲,其中展示了英伟达新推出的世界基础模型开发平台Cosmos和加入的14款人形机器人。文章详细解读了人形机器人的基础参数信息、主要适用场景、核心亮点和背后的核心技术路线等,并讨论了机器人技术特别是人形机器人和通用机器人技术的突破和未来发展。
关键观点总结
关键观点1: 黄仁勋在CES 2025上展示了14款人形机器人,其中一半来自国内机器人公司。
文章详细解读了这些机器人的基础参数、应用场景、核心亮点和核心技术路线等情况。
关键观点2: 黄仁勋强调了通用机器人技术的重要性,并认为机器人的ChatGPT时刻即将到来。
他指出了未来对世界产生重要影响的三类机器人,包括自主机器人、自动驾驶汽车和人形机器人。
关键观点3: 文章讨论了实现机器人技术通用性的重要性,以及通用机器人领域的核心关键。
深度学习强化领域的大牛PieterAbbeel强调了机器人通用性的重要性,并指出当下追求的通用机器人能够在开放环境中解决问题。
关键观点4: 文章提到了人形机器人领域的争议和预测。
例如,清华大学交叉信息研究院院长姚期智认为人形是最适合实现通用具身智能的形态,同时麦肯锡报告预测了机器人行业的增长。
正文
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。
近日,英伟达 CEO 黄仁勋在 CES 2025 的一场主题演讲中提到,「机器人技术领域,特别是人形机器人和通用机器人技术,即将迎来 ChatGPT 时刻般的突破。」在演讲中,黄仁勋公布了英伟达新推出的世界基础模型开发平台 Cosmos,并展示了加入 Cosmos 平台的 14 款人形机器人,其中近一半来自国内机器人公司。本篇解读详细地盘点了 14 款人形机器人的基础参数信息、主要适用场景、核心亮点(相较于其他人形机器人不同的地方)、商业化情况以及背后的核心技术路线等情况。目录
01. 为何实现「通用人形机器人」如此重要?机器人的 ChatGPT 时刻真的来了吗?
机器人技术一旦实现通用性意味着什么?最适合通用具身智能的形态会是人形吗?要想迎来通用机器人领域的「GPT」时刻,哪些因素才是核心关键?02. 老黄选中的 14 款人形机器人:国产机器人梯队的胜算如何?海外机器人梯队情况如何?
黄仁勋展示的 14 款人形机器人都是什么「来头」?国产机器人厂商「突飞猛进」,占据近一半?国内外的各家机器人在技术路线上有何差异?03. 老黄没带上台的机器人种子选手还有哪些?
在 CES 2025 展会上,还有哪些值得关注的机器人?1、黄仁勋认为通用机器人技术的重要性在于,能够创造出无需特殊环境即能适应「棕色地带」的机器人。同时,黄仁勋还在演讲中指出了未来对世界产生重要影响的三类机器人,分别为自主机器人、自动驾驶汽车和人形机器人。2、实现机器人的「通用」非常重要。深度学习强化领域的大牛 Pieter Abbeel 曾表达机器人通用性的重要,「当机器人能够适应不同环境时,就会发生重大变革。」① 传统的机器人需要针对特定的环境、任务,用某种固定的动作序列对机器人进行编程,只针对于结构化的环境有效。而当下,业内追求的通用机器人,能够在一个未设定具体规则、一切皆可变化的开放环境中解决问题。3、同时,基于人形是否是最适合实现通用具身智能的形态,仍存在一些争议。清华大学交叉信息研究院院长姚期智认为,人形是最适合实现通用具身智能的形态。目前只有人类本身达到了真正的通用具身智能,因此人形机器人被视为最好的通用具身智能体。4、据麦肯锡近期发布的一份报告预测,机器人行业的收入到 2040 年将增长至 1900 - 9100 亿美元,年均增长率高达 13%至 23%。机器人领域的潜力不言而喻。5、同样,黄仁勋在其近 1 个半小时的 CES 2025 主题演讲上,重点讲到了对于「Physical AI」的看法。在此期间,黄仁勋公布了英伟达新推出的世界基础模型开发平台 Cosmos,并展示了加入 Cosmos 平台的 14 款人形机器人,其中有 6 款来自国内的机器人公司,8 款来自国外的机器人公司。黄仁勋在演讲中提到,「机器人正在进入 ChatGPT 时刻」。但距离通用机器人领域的「GPT」时刻真的来临,还面临着几点需要克服的「关键难题」。1、首先,是机器人的「大小脑」的大模型的架构还没有统一,各家仍在探索中,如大语言模型的技术路径、模仿学习与深度强化学习的技术路径以及空间模型的技术路径等。目前,尚没有哪条技术路径表现出明显的优势性。① 具体而言,目前较为常见的架构主要有两种。一是将大语言多模态模型直接应用于机器人,并在此基础上增加一部分机器人底层的操作运动集等,使大语言模型能够进行调用,以完成相应任务,这已成为目前最为普遍的架构形式;二是如特斯拉等公司追求的更为端到端的解决方案,采用模仿学习的方式,通过人为采集大量的动作数据来训练机器人。但该方法的「scling law」还没有得到验证。2、其次是,目前机器人的泛化性较差 ......
03 老黄选中的 14 款人形机器人,国产机器人梯队的胜算如何?此次在 CES 2025 主题演讲上,出现在黄仁勋身边的 14 款人形机器人中,有 6 款机器人来自国内的机器人厂商。1、「远征 A2」是由智元机器人于 2024 年 8 月推出的一款智能交互服务机器人,主要场景适用于营销客服、展厅讲解、商超导览、前台接待、业务咨询等。8 月,与「远征 A2」同时发布的远征系列机器人还有「远征 A2-W」和「远征 A2-Max」两款,适用于柔性智造、重载特种作业等场景。2、「远征 A2」全身具备超过 40 个主动自由度的关节和仿人的灵巧双手,能够模拟出丰富和复杂的人类工作。同时拥有一个可以持续学习的大脑,由大语言模型加持。此外,还具备多模态的感知,输入系统,可以通过视觉感知交互者的情绪。① 在语音交互方面,远征 A2 机器人采用了语言大模型+RAG 构建企业定制业务知识库...... 关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读
01 AI 竞赛进入推理阶段:扩展测试时计算是万能的吗?Scaling What 成为关键传统的 Scaling Laws 范式是否已经达到极限?新的 Scaling Laws 范式能否解决数据难题?只要扩展测试时间计算,就能够实现通用人工智能吗?「LLM + 推理模型」是否能实现类人智能?LLM 真的具有推理能力吗?... 02 谁能进入下一轮?具身智能「练习生」的技术储备和商业路径有何异同?具身智能创企融资规模如何?明星「练习生」都有哪些头部资源支持?各家创企技术路径有何差异?「练习生」都有哪些技术储备?具身智能还差些什么?... 03 「压缩即智能」,成就 LLM 的 Transformer 未必是终极解?知识压缩理论已经获得验证了?LLM 范式有变革征兆了?LLM 范式会向哪个方向演进?为什么Transformer 未必能够长青?有哪些声音在质疑Transformer?有哪些非Transformer的可行路线?... 04 从文本到屏幕:「Project Jarvis」们能实现 AGI 吗?头部 AI 公司为何都在做 AI 自主计算机操控?这事可行吗?和RPA的区别是什么?AI Agent自主操控计算机需要具备哪些能力?微软、谷歌、Anthropic 在 AI Agent 方面的动作有何异同?...更多往期专题解读内容,关注「机器之心PRO会员」服务号,点击菜单栏「收件箱」查看。