语言引导的人机互动系统必须满足两个关键的要求,才能被广泛采用:适应性和学习效率。然而,现有的指令跟随代理不能适应,缺乏纳入在线自然语言监督的能力,即使它们可以,也需要数百次的演示来学习甚至简单的政策。
在这项工作中,斯坦福大学研究人员通过提出 "带有修正的语言信息的潜在行动"来解决这些问题,这是一个在执行过程中纳入并适应自然语言修正的框架--"向右 "或 "不,向着书的方向"。
他们在一个共享的自主性范式中探索丰富的操作领域。这不是在人和机器人之间进行离散的轮流操作,而是在人和机器人之间分割代理权:语言是一个学习模型的输入,该模型产生一个有意义的、低维的控制空间,人类可以用它来指导机器人。每一次实时修正都会完善人类的控制空间,从而实现精确的、扩展的行为--其额外的好处是只需要少量的演示来学习。
他们通过一项用户研究来评估该方法,用户与Franka Emika Panda机器人一起工作,完成复杂的操作任务。与现有的涵盖开环指令跟随和单一共享自主的学习基线相比,他们的修正意识方法获得了更高的任务完成率,并且由于其可靠性、精确性和易用性而受到用户的主观青睐。注:本研究案例中采用的机器人为 Franka Emika 机器人 来源 | CAAI认知系统与信息处理专委会
排版 | 麦子
-----------------END-------------------
欢迎加入【机器人大讲堂】读者讨论群, 共同探讨机器人相关领域话题,共享前沿科技及产业动态。
教育机器人、医疗机器人、腿足机器人、工业机器人、服务机器人、特种机器人、无人机、软体机器人等专业讨论群正在招募, 关注机器人大讲堂公众号,发送“ 交流群 ”获取入群方式!
机器人大讲堂正在招募【兼职内容创作者】,如果您对撰写机器人【科技类】或【产业类】文章感兴趣,可将简历和原创作品投至邮箱: [email protected]
我们对职业、所在地等没有要求,欢迎朋友们的加入!