旧金山机器人初创公司Physical intelligence(简称Pi),数月前发布了首个通用机器人基础模型π0。被该模型“附体”的机器人,可执行多种繁复家务,包括但不限于整理杂乱桌面、取出烘干机内衣物并折叠整齐等。Pi创立不足一年,估值已高达24亿美元。
整理杂乱桌面
把咖啡豆从袋中舀入机器
叠衣
在距旧金山近万公里的上海,也有相似范式。近期,全国首个异构人形机器人训练场在沪启用,首期已部署超百台异构机器人。显性来看,训练场是人形机器人正式“打工”前的“技校”,但其更深意义,在于实现人形机器人数据的规模化收集和生产,为开发一个通用型机器人基础模型提供关键支撑。
全国首个异构人形机器人训练场
全国首个异构人形机器人训练场
具身智能也能“大力出奇迹”
“技校”坐落于张江模力社区,由国家地方共建人形机器人创新中心(简称“国地中心”)搭建。国地中心是上海市与工信部共建的人形机器人领域首个国家级制造业创新中心。
记者在“技校”现场看到,大量硅基“学员”,或在训练抓取土豆丝,或手持螺丝刀为冰箱安装背板,或双方对垒踢足球。它们来自智元、傅利叶、开普勒等近10家机器人公司。
机器人对垒踢球
机器人擦桌、抓取胡萝卜丝等
国地中心首席科学家江磊告诉记者,人形机器人的“异构”,是指不同厂家的机器人,其形态、功能、技术架构、应用场景都存在差异。“同一构型的机器人模型最容易训练,但会产生幻觉。把不同厂家的异构机器人放在同一空间运行,就能让AI意识到,它活在一个多元多样的物理世界中,从而建立起客观认知,发育出明辨是非的能力。”
据了解,中国已然是全球第一大的工业机器人生产国。但业内判断,未来几年,我国工业机器人产量将维持在30万至50万套。人形机器人却有望捅破此“天花板”。
相比仅能执行特定单一任务的工业机器人,人形机器人被寄予“高级智能”的厚望。好比ChatGPT等大语言模型在海量语料和算力加持下,进化出“智能涌现”的能力。Pi公司也率先以大数据、大算力、大模型来修炼具身智能,使机器人“泛化”出烧饭叠衣、装配修理、保洁照护等样样在行的复合能力。Pi公司的实践旨在证明,大语言模型“大力出奇迹”的尺度定律,在具身智能模型中依然奏效。
未来人形机器人要烧饭叠衣、装配修理、保洁照护等样样在行。
众人拾“数据”支撑基础模型
人形机器人有着万亿级的市场规模,Pi公司的科研范式创新对于点燃这一赛道的意义,上海也同步嗅到了。
不同的是,作为人工智能高地,上海拿出魄力,对大数据、大智算、大实训场、大模型进行一体化规划,旨在提升追赶世界前沿的速度。江磊告诉记者,路线比努力更重要。如果没有这“四大”AI基础设施作为底座支撑,许多中小创新企业就会另寻路径,如以小参数、小智算或压缩网络结构的方式来训练模型,这显然会拖慢节奏甚至南辕北辙。“我们认为,规模法则仍旧适用于人形机器人,唯有在大的基础设施之下做的创新才是真正的创新。”
高精度双手协同装配加工场景
大语言模型训练中所需文本、图片、视频等数据多是现成的,而用于训练机器人模型的数据却规模有限,各家机器人公司此前又是各自为政。国地中心人形机器人训练场,就要成为一个开放的、鼓励“众人拾柴”的创新平台。中心总经理徐彬介绍,通过异构机器人的同场训练,可源源不断产生数据,并解决数据缺乏统一标准和规范、无法跨平台跨行业迁移和复用等问题。
据透露,训练场今年有望沉淀下1000万条数据,从而形成业内规模领先的异构人形机器人数据集,成为支撑机器人基础模型进化的高质量语料。
记者发现,训练场除了来自10家机器人公司的“学员”外,海尔、海信、康佳、延锋汽车等多家头部企业也与国地中心签署生态场景合作协议。训练场内冰箱、电视、汽车装配训练科目,对应的正是这些龙头企业最真实的生产需求。