专栏名称: 机器人大讲堂
机器人大讲堂是立德共创服务平台旗下引领行业发展的新媒体平台,已举办多种形式系列活动近百场,行业媒体矩阵垂直粉丝20万余人;立德研究院承接智库咨询和科研项目;立德孵化基于顶尖专家优势形成早期高技术成果产业化。
目录
相关文章推荐
环球人物  ·  “反华妖女”破防:金主不给钱了! ·  16 小时前  
南方人物周刊  ·  开学了,大学教授带孩子读四大名著学写作 ·  17 小时前  
每日人物  ·  金价暴涨,年轻人买0.1克金贴在手机上 ·  17 小时前  
每日人物  ·  4亿人都在用的必需品,集体“塌房”? ·  昨天  
51好读  ›  专栏  ›  机器人大讲堂

马斯克人形机器人2年4迭代的秘密找到了

机器人大讲堂  · 公众号  ·  · 2024-03-05 16:53

正文

202 4年,机器人已经朝着更像人迈出了一大步,斯坦福大学团队与谷歌DeepMind团队合作研发的能炒菜、能做家务的双臂机器人MobileALOHA,特斯拉关于能执行折叠衣物等复杂操作的人形机器人,以及Sora的问世,这些事件引发了人们对于通用机器人时代的遐想。


机器人如何进行类人的复杂操作?ChatGPT引起浪潮后,以谷歌PaLM-E为代表的多模态具身VLM不断面世,机器人领域开始采用更多例如动作捕捉的新技术,也出现了许多不同的AI训练方法。


近日一篇机构的调研报告指出,为了让机器人更像人,目前研究和产业界主要有五种主流的探索路径,分别是虚拟仿真、遥操作、模仿学习、VLM+小模型、VLA,而这些主流研究中, 动作捕捉技术这项新技术开始得到愈发广泛的关注。



因为目前,一个瓶颈在于真实数据的获取难度比自然语言更难, 为了加速这些领域的研究,快速获取现实物理世界的真实数据,动作捕捉技术得到了更多重视。 基于强大的光惯融合算法,光学动捕技术的应用面近年来快速扩大,不仅能够对人体进行定位追踪、人体动作细节捕捉,通过光惯融合系统分析软件,还能实现场地校准标定、3D显示、刚体创建、刚体绘制、刚体追踪等功能。


全球多个研究团队都正在依托动作捕捉系统大量采集生成动作数据,形成动作库数据充实大模型,从而为下一代AI+机器人实现运动控制及环境交互的泛化能力提供数据支撑。


▍无人机领域的新突破


无人机就是一个大量应用到 动作捕捉技术 的典型研究领域。


由于在多个无人机协同完成复杂任务时,需要每个无人机具备高精度、高稳定性的空间位置信息。不少无人机前沿研究,正借助光学动捕促进机器人集群协同控制研究。通过光学动捕技术,就可以非常容易可以实现对多个无人机的实时跟踪和控制,从而更好地实现集群协同作业和智能控制。


例如在上海大学一篇在人工智能领域的跨学科期刊“Knowledge-Based Systems”上发布, 名为《基于人工势场A*算法的双无人机协同悬浮运输路径规划》的学术主题论文 ,就通过使用青瞳视觉公司旗下的红外光学动捕系统产品,研究并验证了一种独特的双四旋协同运输机器人APF-A*新算法,最终能在复杂的多障碍物环境中,高效规划出安全可靠的路径。


在该研究中, 上海大学机电工程与自动化学院饶锦军教授研发团队发现,比起传统无人机,四旋翼无人机的容错率更低 ,因此,探究其轨迹规划安全性具有非常大的必要性。该团队于是通过光学动捕产品,获取了真实无人机产品数据,并在此基础上利用虚拟仿真平台AirSim构建了一个虚拟仿真环境,通过强化学习尝试让智能体在虚拟环境中不断试错,从而帮助 无人机学习最优的行为策略,以最终映射到现实中,帮助无人机及时改变队形,实现安全有效的协同空中运输。该项研究将有助于提升飞机的障碍避让能力及应急处理能,提高运输的安全性。


作为国内为数不多能够大规模商业化落地的光学动捕品牌,由于青瞳视觉公司 产品可以采集三维空间轨迹坐标,从而提供低延迟、强稳定、易使用的精确6DOF跟踪,为用户提供关键性能参数。 例如在无人车或无人机的产品研发中,开发者可以快速加入了SLAM算法验证,第三方服务器经过无线网络,结合动捕服务器进入POE交换机,实现更为直观地端对端交互和验证。


▍外骨骼机器人成新落地领域


当然,除了无人机,借助动捕技术优化动作姿态更是目前研究的一大热门。因为动作捕捉 能将真人执行指令的动作通过传感器等设备精准复制给机器人,输入的信息和行动准确且有针对性,这融合遥操作技术,能够快速实现人类分身。


例如此前Mobile ALOHA依托系统收集的数据,就通过人类示教动作学习模仿操作技巧与身体控制。其硬件配置并不高,整套价格仅需3.2万美元,且解决方案为开源。上述成本和配置就能打造出在家庭环境下能够实现诸多功能的Mobile ALOHA, 其关键就在于机器人的运动控制、交互和自主移动两方面。 不仅如此,腾讯RoboticsX 在四足机器人领域也有基于真狗的动捕思路。


在原先, 遥操作技术主要是通过专用设备将人类的动作直接迁移到机器人身上,再由机器人通过传感器收集数据,以达到双向反馈的目的。 但是这需要被操作对象非常清晰,否则无法保证真实环境中的成功率。而如今,大模型飞速发展的当下,借助动作捕捉技术,不仅获取到更加细节化的动作数据,而且能够获取到更丰富的环境数据,考虑到机器人更多属于工程应用层面的创新,动捕+遥操作的方式无疑在实际应用中更加直接有效,能够解决现实场景的刚需,尤其适合人形机器人类似产品使用。


例如江汉大学智能制造学院“外骨骼机器人”研究, 就采取了青瞳视觉动作捕捉系统为其提供技术、设备及全流程服务支持。 借助三维动捕系统,研究能够准确、完整的获取多种运动场景下人体下肢关节呈现的状态特征,为测试实验提供可靠参考、比对数据。基于数据支撑,利于优化外骨骼机器人的运动控制策略,更加真实模拟还原人体运动的姿态,为突破技术难点、提升实验精度,实现下肢外骨骼机器人的仿真控制优化给予了有力支持,创造更多可能。


由于青瞳的视觉动捕技术可进行三维数据分析记录,精准识别记录不同物体运动状态。对于肉眼难以直观记录的下肢运动轨迹提供技术支持。能帮助研究顺利采集包括关节角度、速度、加速度等重要参数,助力人体下肢关节运动特征采集实验的开展。


▍人形机器人创造需求


目前最火热的人形机器人,所表现出的决策执行能力已经逐步向过往的设想靠拢,这也可以采用动作捕捉技术进行支持。


例如此前马斯克的叠衣服视频,很大程度上就借助了类似技术。因为特斯拉在 2023 年股东大会上展示Optimus 的进展时,视频中工程人员就穿戴设备进行演示,如果仔细观察可以发现,其实人类抓取物品的动作就是被 AI 算法精准识别并复制到机器人身上。由于光学动捕技术凭借其高分辨率、高速度和高精度的特点,可以为人形机器人提供更高精度的空间位置信息,这非常有助于提高机器人的定位精度和稳定性,使其能够在复杂的环境中更好地完成各种任务。


当前,青瞳视觉等公司的光学动捕产品,已经能够做到 空间定位精度0.1mm,角度精度0.1°,抖动误差仅0.01mm,而且视场角大,追踪距离远,死角少, 同时支持主动式标记点和被动式标记点,能适应各种场合,并能够支持上千平米的捕捉面积,能够实时追踪其中的数百个目标,支持多种协议,兼容所有的主流软件。


一直以来,人类对于人形机器人的期待是,希望其需要具备与人类相似的结构和运动能力,以便更好地适应人类生活和工作环境。而通过光学动捕技术,研究人员可以实时捕捉和分析人形机器人的运动数据,进而从仿生角度改进机器人的结构和运动控制算法,提高机器人的灵活性和运动速度。

如果更进一步来说,由于人形机器人作为与人类交互和协同作业的重要工具,未来一定需要具备高度智能和自主性。从人类演示中进行模仿学习,是训练机器人在现实世界中掌握技能的一种朝阳路径,其过程可泛化性和迁移性强,尤其适合日常生活场景。


而通过光学动捕技术, 研究人员甚至还可以获取机器人在实际环境中的运动数据和姿态信息,进而利用这些数据优化机器人的行为和决策 ,提高人机交互的准确性和效率。例如《MimicPlay: Long-Horizon Imitation Learning by Watching Human Play》(Chen Wang et al.)就提到,斯坦福的Mobile ALOHA所采用的MimicPlay 框架,其实逻辑就是从人类交互数据中学习潜在行动逻辑,用以指导基于少量遥操作演示训练的低级视觉运动控制,最终实现在任务成功率、泛化能力和对干扰的鲁棒性上的出色表现,执行任务的成功率显著提升。


因为由于机器人本体自身的物理特性问题,导致许多能够在人类身上实现的动作以及路径,想要真正还原到机器人还需要进一步的清洗和优化。虽然动作捕捉到的人类真实数据落地到机器人上仍然存在一定瓶颈,但仍然是一种非常具有潜力的方向。


▍结语和未来


全球许多研究都已经在尝试将大模型等新技术与机器人进行结合,但是直接让机器人或者机械臂在现实环境中与环境进行交互、采样时,都普遍有着采样效率太低、随机采样安全问题大等困扰。尤其对于高成本的人形机器人研究,如果出现转动角度过大或者避障任务中由于碰撞造成的不可逆损伤等,更是不可承受之痛。


通过光学动作捕捉系统,在仿真模拟器中进行强化学习算法的训练无疑能够很好解决上述问题。 而且基于强大的光学动捕产品,能够生成包含视觉等元素的复杂环境内容,形成大规模仿真数据集,丰富机器人样本中的环境和物品细节信息,从而减少细分场景的数据壁垒,降低样本映射迁移到现实机器人过程中可能出现的时滞、幻觉等问题。


目前,例如青瞳视觉由于核心技术源自中科院北京自动化研究所,其软硬件完全自主研发,自主可控,已经开发并成熟发布了多款新品相机及多项解决方案。包括UW系列、D系列、K系列、R系列相机等都非常适用于高校前沿研究,尤其是其2024年1月份新发布的高端光学相机K(鲲鹏)系列,在分辨率、帧速率、捕捉距离上都实现了较大突破,非常适用于人形机器人等相关领域研究。

据悉,作为在光学动作捕捉领域处于领先地位的企业, 青瞳视觉 核心产品MC系列光学相机已经在各种行业得到应用,而且该公司多款产品还可深度定制,满足个性化需求,这使其更容易成为未来机器人厂商和研究者值得信赖的优秀选择。

如需咨询企业合作事宜,欢迎联系堂博士(13810423387,手机与微信同号)进行对接。

----------------END----------------


工业机器人企业

埃斯顿自动化 | 埃夫特机器人 | 节卡机器人 | 珞石机器人 | 法奥机器人 | 非夕科技 | CGXi长广溪智造 | 大族机器人 | 越疆机器人 | 睿尔曼智能 | 优艾智合机器人 | 阿童木机器人 | 盈连科技

服务与特种机器人企业

亿嘉和 | 晶品特装 | 九号机器人 | 普渡机器人 | 机器姬 | 猎户星空

医疗机器人企业

元化智 | 天智航 | 思哲睿智能医疗 | 精锋医疗 | 佗道医疗 | 真易达 | 术锐®️机器人 | 罗森博特 | 磅客策 | 柏惠维康

人形机器人企业

优必选科技 | 宇树 | 达闼 机器人 | 云深处 | 理工华汇 | 傅利叶智能 | 逐际动力 | 乐聚机器人 | 星动纪元 | 天链机器人

核心零部件企业







请到「今天看啥」查看全文


推荐文章
环球人物  ·  “反华妖女”破防:金主不给钱了!
16 小时前
南方人物周刊  ·  开学了,大学教授带孩子读四大名著学写作
17 小时前
每日人物  ·  金价暴涨,年轻人买0.1克金贴在手机上
17 小时前