我 相 信 这 么 优秀 的 你
已 经
置 顶
了 我
翻译|刘筱天
选文|小象
转载请联系后台
大多数机器人的编程方法无外乎以下两种:从演示中学习,观察任务正在完成,然后复制,或通过动态规划技术(如优化或采样),这需要程序员明确指定任务的目标以及限制条件。
麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员最近开发了一个系统,旨在弥补两种技术:C-LEARN,它允许非编码器通过提供一些关于物体如何被操纵的信息来向机器人传授一系列任务然后向机器人展示任务的单个演示。
重要的是,这使得用户能够教导机器人拥有可以自动转移到具有不同移动方式的其他机器人的技能 - 为希望一系列机器人执行类似操作的公司提供关键的时间和成本节约措施。
“通过将演示学习的直观性与动态规划算法的精确度相结合,这种方法可以帮助机器人实现以前无法学习的新型任务,例如使用两臂的多步骤组合。”博士生ClaudiaPérez-D'Arpino,他与麻省理工学院教授Julie Shah一起写了关于C-LEARN的论文。
该团队对Optimus进行了测试,Optimus是一种新型的双臂机器人,专为炸弹处理而设计,用于执行打开门,运输物体和从集装箱中提取物体等任务。在模拟中,他们表明,Optimus的学习技能可以无缝转移到Atlas,CSAIL的6尺高,400磅重的人形机器人。
描述C-LEARN的论文最近被IEEE 5月29日至6月3日在新加坡举行的IEEE国际机器人与自动化国际会议(ICRA)接受。
◇
◆
◇
◆
◇
它是如何运作的
使用C-LEARN,用户首先向机器人提供关于如何达到和掌握具有不同约束的各种对象的信息的知识库。(C-LEARN中的C代表“约束”)例如,轮胎和方向盘具有相似的形状,但是将其附着在汽车上时,机器人必须以不同的方式配置其臂来移动它们。知识库包含机器人所需的信息。
然后,操作员使用3-D接口向机器人显示特定任务的单一演示,其由称为“关键帧”的相关时刻的序列表示。通过将这些关键帧与知识库中的不同情况相匹配,机器人可以自动实现动态规划,供运营商根据需要进行批准或编辑。
佩雷斯·迪阿诺(Pérez-D'Arpino)说:“这种方式其实非常类似于人们如何看待事物的完成情况,并将其与现在已经知道的世界相关联。“我们不能从单一的演示中完美地学习,所以我们需要将新的信息与之前的有关我们的环境的知识相匹配。”
还有一个挑战是,可以从演示中学习的现有限制不够准确,无法使机器人精确地操纵对象。为了克服这个问题,研究人员开发了由计算机辅助设计(CAD)程序启发的约束,可以告诉机器人其手应该与其正在相互作用的对象平行或垂直。
该团队还表明,当与人类合作时,机器人可以表现得更好。 虽然机器人自己成功执行了87.5%的时间,但是在100%的时间内,操作员可以纠正机器人偶尔不准确的传感器测量相关的微小错误。
密歇根大学电气工程与计算机科学系助理教授德米特里·贝伦森(Dmitry Berenson)表示:“拥有知识基础相当普遍,但不常见的是将其与示范学习结合在一起。“这是非常有用的,因为如果你一遍又一遍地处理相同的对象,那么你不需要从头开始教给机器人每一个新的任务。”
◇
◆
◇
◆
◇
应用
该系统是一个更大的研究浪潮中的一部分,重点是使从演示来学习的方法更具适应性。如果你是一个学会从演示中拿出管子的机器人,如果有障碍物需要你移动手臂的方式不同,你可能无法做到这一点。然而,用C-LEARN训练的机器人可以做到这一点,因为它没有学习一种特定的方式来执行动作。
Berenson说:“我们正在从直接模仿运动中脱颖而出,实际上试图推断运动的原理,这对现场是有好处的。”“通过在运动计划器中使用这些学习的约束,我们可以使系统比仅仅尝试模拟正在演示的那些更灵活”
Shah说,先进的LfD方法可能在时间敏感的场景,如炸弹处理和灾难响应中证明是重要的,其中机器人目前在单独联合运动的水平上进行远程操作。