专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
青岛日报  ·  知名巨头宣布解散!曾风靡全球 ·  昨天  
青岛日报  ·  知名巨头宣布解散!曾风靡全球 ·  昨天  
疆土  ·  日本流感病例超950万人!药品短缺 ·  3 天前  
51好读  ›  专栏  ›  大数据文摘

MIT研究登顶会ICLR 2024:让机器人掌握"常识",自主完成复杂家务

大数据文摘  · 公众号  ·  · 2024-04-29 13:20

正文

大数据文摘受权转载自机器人大讲堂

在人工智能飞速发展的今天,家用服务机器人正日益走进寻常百姓家。然而,要让机器人像人一样灵活应对家庭环境的复杂多变,仍面临诸多挑战。据探索前沿科技边界,传递前沿科技成果的X-robot投稿,近日,麻省理工学院(MIT)的一个研究团队提出了一种创新方法,让机器人通过学习"常识性知识",在没有人类辅助和预设编程的情况下,自主执行家务并进行自我纠错,大大提高任务完成的成功率。这项研究以"Grounding Language Plans in Demonstrations Through Counterfactual Perturbations"为题发表在人工智能顶会ICLR 2024上,为家用机器人的进一步发展指明了一个充满想象力的崭新方向。



传统方法的局限性


服务机器人想要完成家务,通常采用模仿学习的方式,由人类为其示范和编程。但这种方法存在明显局限性。机器人往往需要严格按照预设轨迹执行任务,一旦中途受到外界干扰而偏离既定路线,就很容易陷入错误和失败。比如,在"将珠子从一个碗舀到另一个碗"这样简单的任务中,若机器人在舀珠子或移动过程中受到推挤或碰撞,传统的机器人往往只能停下来,从头重新开始,缺乏灵活调整的能力。


究其原因,是由于机器人缺乏对任务的整体理解和必要的常识。对人类而言,舀珠子其实是个连续的动作序列,包括伸手够碗、舀珠子、移动到目标碗、倒珠子等一系列子任务。当某个环节出错时,我们自然懂得如何适时调整,把控全局。但机器人却缺乏这种常识和智慧。如何打破这一瓶颈,让机器人学会像人一样思考和应变,成为一大挑战。


语言模型赋能机器人


为突破传统方法的局限,MIT研究团队另辟蹊径,利用大型语言模型(LLMs)强大的自然语言理解和生成能力,让机器人学习人类的思维方式和常识推理能力。



大型语言模型是当前人工智能领域最前沿、最具突破性的技术之一。它通过海量文本数据的训练,可以准确把握词汇、句法、语义之间的关联,进而实现对自然语言的深度理解和生成。研究人员发现,语言模型所蕴含的常识性知识,与机器人完成家务所需的推理能力不谋而合。


于是,他们首先让语言模型根据任务描述,自动生成一系列抽象动作,如"够"、"舀"、"运"、"倒"等。这些动作的先后顺序,实际上隐含了人类对该任务的逻辑理解。接着,研究者将这些语义动作与机器人执行任务采集的运动数据相结合,构建了一套端到端的机器人控制系统。该系统可以实现语言理解、视觉感知、运动规划和控制的无缝衔接,让机器人学会主动思考和规划任务,对外界干扰做出灵活适应。


实验验证成效显著


为验证新方法的有效性,研究团队设计了"舀珠子"的实验。传统的机器人需要按照预设轨迹,一板一眼地将珠子从一个碗舀到另一个碗,而一旦出错只能从头再来。



采用新方法后,情况发生了显著变化。得益于语言模型的协助,机器人学会了将任务拆解成"伸手够碗"、"舀珠子"、"移动到目标碗"、"倒珠子"等多个连续子任务。在执行过程中,如果机器人在某个环节受到外界干扰,导致手臂或夹具等发生位移,它可以迅速意识到问题,自主进行轨迹规划修正,继续执行后续步骤,直至圆满完成整个舀珠子的任务。


通过对比实验,研究人员发现,应用新方法的机器人展现出接近人类的智能和灵活性。面对各种意外情况,它们能从容应对、见机行事,任务成功率较传统机器人大幅提升。更可喜的是,机器人能在新环境中举一反三,将学到的技能迁移到类似的新任务,这与人类思维特点不谋而合。



对机器人发展的启示


这项创新性的研究,为智能家用机器人的发展提供了新的思路和方向。传统的机器人采用预设编程和人工示教的方式,往往难以应对家庭环境的复杂多变。通过引入大型语言模型,并将其与传统机器人技术进行创新融合,有望大大提升机器人的环境适应能力、学习能力和推理能力,使其更好地模拟人类智能。这对于研发全能型家用服务机器人具有重要意义。


不过,该方法目前还存在一些不足。尽管它在减少人工参与方面取得了进步,但训练机器人仍需要在可控环境中进行大量试错和数据采集,数据效率有待进一步提高。此外,语言模型的引入对机器人系统的架构和训练方式提出了新的要求,如何更好地实现语言、视觉、规划和控制的融合,让机器人形成完整的认知和执行闭环,还有待进一步探索。


未来,研究者计划采用主动学习、端到端学习等先进技术,进一步提升机器人的数据效率、自主学习能力和鲁棒性,并将该方法拓展应用到更多类型的家务劳动和服务场景中。随着人工智能技术的日益成熟,智能家用机器人助手已不再遥不可及。我们有理由相信,在不久的将来,集聪明和能干于一身的全能型机器人将走入千家万户,为人类的生活带来更多便利和幸福。


租售GPU算力
租:4090/A800/H800/H100
售:现货H100/H800

特别适合企业级应用






请到「今天看啥」查看全文