过去100年的技术发展远高于前一千年。人工智能(AI)的发展就是一个典型的例子,如今不断有更新、更好的项目涌入市场,使得我们正在见证这个飞速变化的时代。
近日,人工智能公司Skild AI宣布成功完成3亿美元A轮融资,此次融资的估值为15亿美元,由Lightspeed Venture Partners、Coatue、软银集团和杰夫·贝佐斯(通过Bezos Expeditions)领投。其他参与者包括Felicis Ventures、Sequoia、Menlo Ventures、General Catalyst、CRV、亚马逊、SV Angel和卡内基梅隆大学。
Skild AI是一家于2023年5月成立的AI初创公司,由卡内基梅隆大学孵化,被视为Open AI的竞争对手之一。Skild AI的联合创始人是两位前卡内基梅隆大学教授Deepak Pathak和Abhinav Gupta,两人都是印度裔,目前拥有150+的H指数,超过90000次引用,成果贡献在世界机器人和AI领域居于最前列。其团队还包括来自Meta、特斯拉、Nvidia、亚马逊和谷歌的专家,以及卡内基梅隆大学的学生。
Deepak Pathak和Abhinav Gupta在卡内基梅隆大学的主要研究创新突破包括自监督机器人学习、好奇心驱动学习算法和大规模自适应SIM2REAL策略等领域,在此基础上,他们希望建立一个机器人“通用大脑”基础模型。这种能够安装到各种机器和机器人设备上的人工智能系统被他们称为“通用大脑”。基于这种模型,各类机器人硬件只需经过简单改装,就可以实现更大的任务完成能力,机器人将能够立即处理各种任务,例如爬陡坡、绕过路径上的障碍物以及识别和拾取物品,
该公司表示,在上一阶段,他们已经通过在更多的机器人上采集各类数据上训练了其AI模型,同时构建了一个可以适配到各类现有硬件上的系统,展示了跨机器人和任务的无与伦比泛化性能力,为现实环境中的自动化应用提供了巨大潜力。
卡内基梅隆大学机器人研究所所长马修·约翰逊·罗伯森(Matthew Johnson-Roberson)表示,Skild AI由站在机器人技术创新前沿的的专家创立,我迫不及待地想见证他们的尖端技术如何彻底改变行业,并延续卡内基梅隆大学在转化研究方面的悠久历史。
▍
机器人共享通用大脑?
Skild AI正在构建所谓的“共享的通用大脑”,该大脑能与任何类型的机器人集成,包括具有先进计算机视觉技能的人形机器人,以及机器狗在内的各种各样机器人,帮这些机器人能够更好在各种场景中执行多种任务,例如操纵物体、移动和导航,旨在未来能为家庭和工业环境带来更具部署弹性且具有灵活操纵物体能力的机器人。
Skild AI的创业初衷在于,他们发现无论什么机器人,都需要“大脑”来独立执行任务。传统意义上,这些为了执行任务的机器人大脑需要非常多专业化的数据,才能专注于执行非常狭窄范围的任务。但与大型语言模型不同,机器人领域没有现成的互联网数据。于是,Skild AI希望通过一个统一的AI大脑来改变这一现状。为此,Skild A开发了通用Robot Brain,这是一种可用于任何机器人的AI模型。
机器人大脑一直是机器人系统的核心人工智能模型,一般用于指挥机器人根据其编程执行简单的任务。该公司声称,Robot Brain这个通用大脑可以使任何类型的机器人更加敏捷、灵巧,并且在与人类互动时更加安全,能够适应各类场景需求,减少环境的定制化开发,将允许机器人在各类场景执行所有复杂且具有挑战性的任务。
Robot Brain的进化方式是通过提供来自文本、图像和视频的真实工作任务数据来训练,就像人工智能聊天机器人接受训练的方式一样,让从预编程机器人转向动态自适应机器人。然而,Robot Brain还能接受模仿学习任务以及随机任务的具身训练,从而可以在人形机器人等实体上实现类似人类的身体运动。
Skild AI表示,其AI模型是在比竞争对手使用的数据集“大1,000倍”的数据库上进行训练的。例如亚马逊拥有庞大的GPU集群,就可以用于训练其Bedrock AI系统。据说,目前Skild AI使用的数据库是通过各种方式收集的,例如通过雇用人类承包商远程操作机器人并教它们以这种方式执行任务,同时还包括数百小时的公开视频,通过所谓千倍以上的训练数据量,让机器人从没见过的任务也能实现泛化,从而将机器学习理念推向了极致。
超庞大训练数据喂养下,使得Skild AI模型的真正与众不同之处在于,它们可以帮助机器人执行从未接受过训练的任务。这些“突发能力”通常是相当简单的动作,例如捡起机器人掉在地板上的物体,或旋转物体以更好地操纵它。创始人兼首席执行官Pathak希望,Skild AI这个大脑在未来无需训练就能执行随机任务,就像人类等生物体获得移动执行任务的能力一样,成为一种任务“本能”。
▍
全新的机器人大模型架构?
到目前为止,AGI仍处于理论阶段,除了需要类似于OpenAI的ChatGPT和xAI的Grok开发所需的大规模算力基础设施,以及需要Nvidia和AMD等芯片制造商的支持,而且因为物理现实的规则,可能还需要一种大模型与物理现实模型的融合创新。
有专家表示,大型预训练视觉语言动作模型(VLA)展现出与大型预训练语言模型(LLM)相同的涌现行为,但AGI不是只能通过数字知识来构建,因此Skild AI或许不仅限于此,其模型可能采取了一种全新的融合系统架构,通过基于Transformer的自适应架构和物理现实Scaling Law,从而搭建了新的机器人底层操作系统,让其通用、鲁棒且具备涌现行为,这使得通用机器人基础模型可能真正有望成为机器人创新链条中的关键环节。
一般而言,系统架构的选择是决定人形机器人与大模型结合的开发和部署中的关键因素,目前,分层架构和端到端架构是两种世界主流的设计方法,各有其优势和应用场景。
如OpenAI和Figure所采用的分层架构,主要通过将感知、决策和行动分成处在不同层次的模块来处理,增强了系统的稳定性和可维护性,这种结构允许各层之间进行信息流和命令
流交互,便于单独优化和调试。
英伟达的DrErureka项目和谷歌DeepMind的AIagent项目则展示了端到端架构的强大能力。端到端架构(Any2Any)提倡一个统一的大模型直接从输入到输出学习任务,强调通过单一的神经网络处理从感知到动作的全部过程,以期达到更高的操作灵活性和效率。这种架构尝试通过直接学习输入到输出的映射来简化系统的训练和部署,适用于处理复杂的、动态的任务环境。
与那些为特定应用垂直设计的机器人不同,Robot Brain尝试融合这两种架构优势的混合系统,借助机器学习算法,涵盖操作、移动和导航等功能,从而能以实现更高效、更智能的机器人解决方案,机器人能像人类一样适应非结构化环境。
今年早些时候,Skild AI的Robot Brain已经在多个机器人上进行了测试,并表示这些机器人能够执行其从未见过机器人执行的任务,表明Skild AI的机器人可以在工作任务中学习。例如机器人能够通过学习快速掌握如何爬楼梯,这在传统的机器人训练中是一个非常复杂的稳定性问题,但通过Robot Brain大脑,正在构建的大规模模型展示了跨机器人和任务的无与伦比的泛化和新兴能力,为现实环境中的自动化应用提供了巨大的潜力。
▍
场景与未来工作展望
该公司认为,未来很长一段时间内,人类劳动将迫切需要机器人,理由是美国“劳动力严重短缺”,可用岗位已超过170万个,建筑、医疗保健、制造和仓储等行业缺口最大。它引用了美国全国制造商协会的数据,该协会预测到2030年仅制造业领域就将有超过210万个职位空缺。这些工作很多都是重复性的、单调的任务,有些还很危险,因此Skild AI认为只要有可能,就应该使用机器人来执行这些工作。
但是受到最新的政府政策影响,美国的人工智能公司以及机器人公司与全球主要人才和制造输出国进行了进一步的脱钩,这使得人们将需要更加迫切借助通用机器人,从而在任何环境下、以任何类型的形式安全地执行任意自动化任务,并再次基础上可以进一步扩展机器人的功能、降低其成本,并支持严重短缺的劳动力市场。
Skild AI认为,机器人通用大脑的出现,就有可能改变整个实体经济的机器人技术规模化的重大变化趋势。因为该技术的泛化能力,可以让机器人在危险环境和医院等缺乏人力的地方工作,在现实环境中也具有巨大的自动化潜力。
对于Robot Brain泛化能力的提升依然高度依赖于现实机器人数据的采集,Skild AI认为,对于人类来说,拥有更多知识总是一件好事,对于机器人来说也是如此。机器人需要先理解现实世界,才能在其中成功运作。因此Skild AI的初期做法必然是大规模扩展机器人AI的训练数据集,为它们提供更多通用知识。让机器人发现能在现实世界中能做些什么。
在未来,Skild AI打算采用与OpenAI类似的商业模式,本质上是出售机器人AI大脑的使用权。因此,客户将能够通过微调其基础模型来创建能够执行各种任务和用例的机器人。目前,Skild AI将继续利用新资金改进其人工智能模型,同时寻求商业部署。该公司还计划扩大其AI、机器人、工程、运营和安全团队,其长期目标是创造一种与人类一样有能力且“扎根于物理世界”的通用人工智能。
外媒认为,Skild AI公司的理念和产品在全世界范围内都有着独一无二的特性,正在重新定义人类对机器人能力的认识,因为一直以来,基于大数据和图神经网络正是AI技术进步的催化剂,如今,Skild AI围绕AI基础模型和核心原则,将其运用到现实世界创新,让该行业开始走上了通用机器人的道路。
红杉资本合伙人Stephanie Zhan认为,Skild AI将推动机器人世界迎来“GPT-3时刻”。她说:“它将引发一场巨大的转变,带来类似于我们在数字智能领域所见的进步,但这一次它们将发生在物理世界中。”
如需咨询企业合作事宜,欢迎联系堂博士(13810423387,手机与微信同号)进行对接。
----------------END----------------