24年4月来自斯坦福的论文“One-Shot Transfer of Long-Horizon Extrinsic Manipulation Through Contact Retargeting”。
外部操纵,即利用环境接触来实现操纵目标,可以实现平行钳式夹持器无法实现的策略。然而,由于场景多样性、动作空间大和接触动力学困难,在机器人、目标和环境之间编排长范围接触交互序列极具挑战性。大多数外部操纵都是短范围操作基元的组合,每个基元都强烈依赖于从理想的接触配置进行初始化才能成功。因此,通过重定位接触要求,将一种外部操纵轨迹泛化到不同的目标和环境。建立一个强大的短距离、目标条件基元策略库,并设计一个框架来组成源自每个基元接触规范的状态约束。给定一个测试场景和一个规范基元序列的单个演示,该方法会在测试场景上强制执行状态约束,并使用逆运动学(IK)找到中间目标状态。然后由基元策略跟踪目标。使用 7+1 自由度机械臂夹持器系统,在 4 个长范围外部操控任务中实现 80.5% 的硬件总体成功率,每个任务最多有 4 个基元。实验涵盖 10 个目标和 6 种环境配置。该方法适用于广泛的演示,并且接触重定位确实是成功组合基元进行长范围外部操控的关键。
如图所示:将目标检索任务从人类演示(顶部)重定位到燕麦(中间)和烙饼(底部)。这个 4 项基本任务包括从障碍物之间拉出目标、将其推到墙上、靠墙旋转以露出可抓取的边缘,最后抓住目标。每行按时间顺序从左到右显示一条轨迹。
外部操纵是指利用环境接触来辅助操纵 [26],是机器人操纵研究的一个新兴领域。利用环境接触,简单的平行钳口夹持器可以完成原本不可能完成的复杂任务。例如,可以通过首先执行一系列涉及推动、旋转和拉动的预抓取动作来拾取处于不可抓取初始姿势的目标 [3, 36, 35]。
实现外部操纵需要整体协调机器人、目标和环境之间的接触交互。特别是,机器人必须能够处理现实世界中存在的各种目标和环境几何形状。早期的研究尝试通过明确建模接触动力学来执行控制合成 [9, 12, 1]。然而,由于接触动力学建模本身的困难,这些研究仅限于操纵具有简单几何形状的已知目标。最近关于外部操纵的文献试图产生基于强化学习 (RL) 的外部操纵策略,这些策略可以泛化到新目标 [36, 20, 37, 8, 35],但泛化到新环境是两回事。
此外,操纵中的许多应用,例如遮挡抓取 [36],本质上是长期的,需要多次接触切换。为了克服制定长期规划的困难,一些文献试图利用演示 [14, 6, 22]。然而,要实现接触丰富的操纵,单个任务可能需要数百次演示 [14, 6]。
其他寻求实现长期操纵的研究,利用分层结构来抽象出重复的低级运动“原语” [24, 16, 11, 2]。虽然大多数长期外部操纵不过是短期固定接触配置基元的组合,例如“推动”和“旋转”,但外部操纵基元的抽象难度明显高于拾取、放置或末端执行器移动等简单基元 [24, 16]。外部操纵基元利用复杂的接触交互,例如“旋转”要求目标与环境障碍物接触。这施加了与场景相关的接触前提条件,并加剧了模拟与现实之间的差距。然而,一旦满足了接触前提条件,外部操纵基元就更有可能成功。
本文方法基于以下观察:一个机器人带有 1DoF 平行钳口夹持器和 7 自由度 (DoF) 机械臂,其状态 s 和姿态 x。
-
1)长范围外部操纵可以分解为基于接触开关的一系列原语。
-
2)一小组原语足以捕获大多数外部操纵。
-
3)每个原语的成功在很大程度上取决于是否满足所需的接触配置 σ。
-
4)在假设 2 和 3 下,满足接触配置 σ 仅需要选择依赖于环境的 x。
外部操纵的重定位可以分解为以下步骤:
-
1) 为任意环境 E , 目标 O 准备一个短范围基元库;
-
2) 识别演示中的基元序列;
-
3) 将目标状态从 演示的E ̄, O ̄ 重映射到 E, O
-
4) 组合重映射的基元序列以实现操作目标 G
如图所示方法概述:准备一个基元库并在线定义每个基元的接触要求。给定一个演示任务轨迹和一个测试场景,通过强制接触要求将演示重定位到测试场景。然后使用演示的基元序列在测试场景中执行任务。
为 σ^x 实现以下环境-目标约束类型。
为 σ^(q|x) 定义以下机器人-目标约束类型。给定 x 后,相对于世界框架和环境指定的约束定义明确。
-
1) 顶部:夹持器指尖大致与目标的“顶部”接触。这是通过找到目标边框的世界 z 坐标最高的 4 个顶点,然后找到这 4 个点的几何中心来实现的。通过将末端执行器从几何中心沿世界 −z 移动直至建立接触,可以找到机器人-目标接触点。
-
2) 对立(antipodal):夹持器指尖与目标在墙壁-目标接触的另一侧接触。这通过两个约束的交点实现:目标与指尖之间的距离为零;指尖位于以目标几何中心为中心的圆锥体内,以墙壁法线为轴,半角为π/6。
-
3) 抓取:末端执行器的位置使得夹持器闭合时可实现自上而下的目标抓取。
这些约束在外部操作原语中的使用情况总结在下表中。