专栏名称: 计算机视觉深度学习和自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
相关文章推荐
姑苏晚报  ·  刚刚,苏州公积金中心回应! ·  12 小时前  
媒哥媒体招聘  ·  上海中西书局有限公司招聘! ·  2 天前  
媒哥媒体招聘  ·  明星造型团队THEICON急招造型师等岗! ·  3 天前  
天玑-无极领域  ·  1、降低杠杆,增加容错率。2、减少交易频次, ... ·  2 天前  
岳西网  ·  曝光!岳西街头他们被拍下! ·  2 天前  
51好读  ›  专栏  ›  计算机视觉深度学习和自动驾驶

GELLO:一种通用、低成本、直观的机器人遥控框架

计算机视觉深度学习和自动驾驶  · 公众号  ·  · 2024-09-27 00:09

正文

24年7月更新的伯克利分校论文“GELLO: A General, Low-Cost, and Intuitive Teleoperation Framework for Robot Manipulators”。

人类可以远程操作机器人来完成复杂的操作任务。模仿学习已经成为一个强大的框架,它利用人类的远程操作演示来教机器人新技能。然而,学习策略的性能受到演示数据的质量、规模和多样性的制约。本文旨在通过提出一个通用框架来构建低成本、直观的机器人操作远程操作系统 (GELLO),从而降低收集大量高质量人类演示数据的障碍。给定一个目标机械臂,利用 3D 打印部件和经济实惠的现成电机构建一个具有与目标臂相同运动结构的 GELLO 控制器设备。GELLO 易于构建且使用直观。通过广泛的用户研究,与模仿学习文献中常用的其他经济高效的远程操作设备(如虚拟现实控制器和 3D 空间鼠标)相比,GELLO 能够实现更可靠、更高效的演示收集。还进一步展示了 GELLO 执行复杂双手和接触式操作任务的能力。为了让每个人都能使用 GELLO,为 3 种常用机械臂设计并构建 GELLO 系统:Franka、UR5 和 xArm。

如图所示为三种不同类型机器人构建的 GELLO 远程操作系统:(A)两个 UR5、(B)一个 xArm 和(C)一个 Franka。用户可以通过控制 GELLO 设备来远程操作机器人手臂。每个 GELLO 设备的物料清单不到 300 美元。


近年来,机器人技术经历了一场显著的变革,推动力是数据驱动方法,其在从感知到控制等各个组件中的日益集成。 从各种数据中学习的能力有助于机器人推广到新的场景,而这是人工设计的系统难以实现的。 对于操纵而言,利用模仿学习 [1]、[2]、[3]、[4] 取得了巨大成功,其中系统性能随着数据集的增大而提高 [5]、[6]、[7]、[8]。 然而,现有系统仍然受到数据集大小以及数据集内任务的复杂性和多样性的瓶颈。

人类遥控操作,一直被证明是控制机器人操纵器收集模仿学习演示的最佳方式之一。远程操作有着悠久的历史,使机器人能够在各种具有挑战性的情况下表现出色,例如日常任务的精细操作 [9]、机器人手术 [10]、[11]、[12]、水下探索 [13]、[14] 和灾难救援 [15]、[16],所有这些都是机器人需要学习的有用技能。这些系统中使用的远程操作设备的共同特点是其双向能力,这使得操作员不仅可以向机器人发出命令,还可以从机器人环境中接收力反馈。虽然这些远程操作系统性能良好,但由于其严格的系统要求,通常需要高保真传感器,从而导致更高的成本,最终限制了其使用性。

因此,一种更常用的方法是构建一个遥操作系统,该系统从 3D 鼠标 [17]、VR 控制器 [18]、[19] 或摄像头等低成本商用电子设备捕获控制信号,然后将其转换为机器人动作。然而,这些系统抽象出机器人的运动学约束,对新用户来说可能不太直观。 “低成本开源双手遥操作硬件系统”(ALOHA) 提出了一种遥操作系统,该系统利用现成的伺服臂来控制具有相似尺寸和运动学的机械手,尽管是单侧的,但仍显示出对细粒度操作任务的令人印象深刻的遥操作能力 [9]。尽管如此,ALOHA 系统是针对特定的机械臂量身定制的,并且由于需要额外的机械臂作为用户的控制器,因此成本较高。

从演示中学习是一种流行的框架,可使机器人执行各种任务 [5]、[6]、[7]、[4]、[29]、[47]、[48]。先前的研究已经观察到,学习系统的性能与数据集的大小成正比。因此,人们正在努力收集越来越大的数据集 [49]、[50]。然而,收集人类的演示可能既昂贵又耗时。例如,Brohan [5] 所做的数据收集过程由一个研究小组耗时 17 个月完成。另一方面,人们已经为改善人机交互做出了巨大努力,以解决瓶颈问题。一些例子包括人类和机器人之间共享控制权 [20],或使人类能够同时操作多个机器人 [51]。这些方法与本文目标是互补的,即构建更易于访问和直观使用的遥操作系统。最后,一个有希望的方向是直接 从人类视频中学习 [52],[53],[54],[55],[56],[57]。虽然直接收集人类执行任务的视频相对便宜,但克服机器人和人类之间的形态差距仍然具有挑战性。


GELLO 的设计重点是创建一个既经济实惠又易于使用的界面,以便用户在机器人学习中呈现高质量的演示。主要设计原则总结如下:


• 低成本: 目标是展示一个功能强大的系统可以以可承受的价格构建,从而最大限度地降低进入门槛。 这是通过使用经济的反向驱动伺服电机、3D 打印组件和简约设计来实现的,从而可以构建一个价格低于 300 美元的远程操作解决方案。 成本比较如表所示。 在用户研究中会展示 GELLO 优于其他低成本选项,同时比其他系统便宜得多。

• 功能强大: GELLO 的设计易于人类操作员使用。 演示 GELLO 在一系列复杂的双手操作和接触丰富的任务中的能力。

• 便携性: 在不同任务和环境中收集的演示数据多样性对于学习系统的最终性能至关重要。 因此,将 GELLO 设计得紧凑、独立,便于运输。 演示 GELLO 在实验室和野外环境中执行任务的情况。

• 易于复制: 除了现成电机和 3D 打印组件外,零件采购很少。







请到「今天看啥」查看全文