要想实现机器人广泛家用,让人人都能“隔空取物”,需要克服这这四大问题。
智东西 文 | 英特尔中国研究院
别误会,我们今天要谈的可不是玄幻的魔法,而是机器人!
在如今这个高度智能化的时代,无人机已经在为我们记录生活,自动驾驶汽车也早已开始上路测试,物流机器人正被广泛推广。不难发现,机器人与我们的生活联系得越来越紧密。
然而,机器人产业的迅速发展目前还没能让广大民众为之欢呼雀跃。对普通民众而言,机器人的工业运用离他们太遥远。他们可能也无法理解,在工业上被广泛使用的机器人为何迟迟无法进入“寻常百姓家”?其实,由于工厂的环境相对单一,工业机器人只需要按照设定好的程序运行就能够批量完成流水化作业。
(车间中的工业机器人)
但人类的世界纷繁复杂,这种非结构化环境给机器人高效运行带来了极大的困难。真正能走进千家万户,给大家带来欢乐与便利的服务型机器人少之又少。抛开复杂程度较高的任务不说,仅仅是让机器人给我们递上一杯沏好的热茶,让我们能够凭借指令“隔空取物”,就还有一些技术难点需要被攻克。
感知技术
为了让机器人很好地完成取物任务,机器人需要有传感器(如英特尔®实感™摄像头)来确定物体的位姿。传感器相当于机器人的眼睛,机器人通过传感器可以实时获取环境的RGBD信息。其中事先学习过的环境中物体可以通过神经网络被识别,并获得相应的空间位置。 但家庭场景十分复杂,又有各类纷繁的物体,在这样的环境中机器人如何自动、准确地识别、分割并计算出目标物体的位置及形状信息仍是一个难题。
抓取规则
仅有一双眼睛显然还无法帮助我们实现“隔空取物”。家庭环境中物体多样,为了适应这些不同种类、不同形状的物体,机器人还需要一双灵巧的机械手。在执行抓取任务时,机器人的抓取规划可以被分为手臂运动规划和手部抓取规划两个部分。手臂在运动时,需要通过外部传感器,如英特尔®实感™摄像头,将环境信息导入模拟环境用于避障,通过优化运动路径,确保手臂能够安全、高效地运动到机器人抓取所需要到达的位姿。手的抓取姿态,可以借助GraspIt!(用于机械手抓取的开源模拟软件)等工具模拟生成,也可以通过训练的神经网络生成。这些方式都需要保证生成的姿态能够在理想情况下成功抓取。简而言之,就是要让机器人学会在识别出物体之后自己找到抓取物体的路径,并调整到合适的手势。可路径、手势选择太多,怎样才能执行好任务,为此机器人也很纠结。
(通过搭载在手臂上的传感器信号进行机械臂及手爪控制)
多变的现实环境很可能造成“将在外,军令有所不受”的情况。机器人在执行具体任务时所规划的策略方案可能无法一一复现。此外,机器人获取的外界数据会存在大量噪声,预先规划的策略可能无法保证抓取成功。这时就需要借助搭载在机械手上的传感器,发挥实时的末端感应和快速调整功能。依据传感器信息对物体抓取是否稳定进行实时判断,并且做出相应调整,从而保证抓取的稳定性。如何及时、灵活地处理随时可能出现的小状况,正是实现稳定抓取需要解决的问题。如下图,当研究人员不断往杯子中增加物体时,机器人会实时调整手指的位置和抓取的力度,从而保证抓取的稳定性。
(图片来源:《机器人抓取的前世今生》,作者李淼)
学习能力
你一定不想要一个永远不会举一反三的机器人。当环境发生变化,你肯定希望它能够快速学习并适应新的工作环境。实验室或者工厂的训练场景无法涵盖机器人进入家庭之后将会面临的所有任务。无论是选择具有更强泛化能力的模型,还是利用模仿学习获得新的技能,如何让机器人拥有一颗不断学习的“最强大脑”也是需要我们努力的方向。
当然,克服了这四大问题以后,要想实现机器人广泛家用,让人人都能“隔空取物”,还要考虑一个非常现实的因素,那就是造价!目前,服务型机械臂的普及度逐步提高,更多机械臂厂家开始推出低成本服务臂。相信在不远的将来,机械臂的成本有望大幅下降。而在机器人手爪领域,目前已得到应用普及的机械夹爪虽然不足以应对纷繁复杂的家庭环境,但是在抓取需求的推动下,其成本也会从现在少则十万,多则近百万的情况逐步趋于平价,设计上也会进一步优化。
在机器人这样综合的学科领域,软件、硬件深度整合能够更加有效地推动技术发展。目前,英特尔中国研究院的团队正致力于解决机器人抓取操控所面临的问题,从基于RGBD以及力传感信息的多传感器融合入手,利用自主研发的机械手平台进行与机器人抓取操控相关的技术研究,欢迎持续关注。