专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
目录
相关文章推荐
深圳发布  ·  送打车优惠券!这波交通福利快来接住! ·  3 天前  
深圳发布  ·  深圳发布 x 荣耀终端,送限量哪吒周边!! ·  3 天前  
深圳大件事  ·  突发!张兰、汪小菲,被无限期封禁! ·  3 天前  
51好读  ›  专栏  ›  计算机视觉工坊

机械臂+轮式/足式机器人开源方案汇总

计算机视觉工坊  · 公众号  ·  · 2024-10-12 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

来源:具身智能之心

添加小助理:cv3d008,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入「 3D视觉从入门到精通 」知识星球 ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!




机器人的移动+抓取是具身智能中非常重要的研究方向,也是目前工程化落地努力的分支,具身智能之心为大家汇总了最新和经典的机械臂+轮式/足式机器人方案,后续将持续补充。

1)Open-World Mobile Manipulation System

卡耐基梅隆大学出品,将机器人部署在开放式的非结构化环境(如家庭环境)中一直是一个长期存在的研究难题。然而,机器人的研究往往仅限于封闭的实验室环境中,而以往关于移动操作的研究仅限于抓取-移动-放置的任务,这可以说是该领域中的冰山一角。“开放式世界移动操作系统”是一种全栈方法,用于解决现实世界中铰接式物体(如开放式非结构化环境中的真实世界的门、橱柜、抽屉和冰箱)的操作问题。这里提出了一种自适应学习框架,在该框架中,机器人首先通过行为克隆从小规模数据集中学习,然后针对超出行为克隆(BC)训练领域的新变体进行在线自我实践学习。开发了一个低成本的移动操作硬件平台,该平台能够在非结构化环境中反复进行安全、自主的在线适应,成本约为2万美元。在不到一个小时的试验期内,系统显示出显著改善,从行为克隆预训练的50%成功率提升至在线适应阶段的95%成功率,全程无需任何人为干预。

项目链接:https://open-world-mobilemanip.github.io/

2)GOAT

Go To Anything智能体是首个通用导航系统,能够在完全未见过的环境中搜索并导航至任何指定的物体,无论该物体是以图像、语言还是类别的形式指定,且无需预先计算地图或物体的位置。

项目链接:https://theophilegervet.github.io/projects/goat/

3)Mobile ALOHA

Mobile ALOHA是一个低成本且支持全身远程操作的数据采集系统。它在ALOHA系统的基础上增加了移动底座和全身远程操作界面。Mobile ALOHA能够自主完成复杂的移动操作任务,如煎制并呈上一块虾、打开双门壁橱存放沉重的炊具、呼叫并进入电梯,以及使用厨房水龙头轻轻冲洗用过的锅具。

项目链接:https://mobile-aloha.github.io/

4)ALOHA 2

ALOHA 2:一种增强的低成本双手远程操作硬件。ALOHA 2是ALOHA的增强版,与原设计相比,在性能、人体工程学和鲁棒性方面都有显著提升。为了加速大规模双手操作领域的研究,作者开源了ALOHA 2的所有硬件设计,并提供了详细的教程,同时还提供了带有系统识别的ALOHA 2的MuJoCo模型。

项目链接:https://aloha-2.github.io/

5)SayCan

Google机器人研究团队出品,通过大语言模型控制机器人执行。

项目链接:https://say-can.github.io/


这里给大家推荐一门我们最新的课程 国内首个面向具身智能方向的理论与实战课程》







请到「今天看啥」查看全文