专栏名称: 雷峰网
中国智能硬件第一媒体
51好读  ›  专栏  ›  雷峰网

南佛罗里达大学孙宇教授:机器人灵巧手抓取的复兴

雷峰网  · 公众号  · 科技媒体 硬件  · 2016-08-13 21:36

正文



在8月13日的CCF-GAIR峰会“机器人与未来”专场中,南佛罗里达大学计算机系的孙宇教授,发表了关于灵巧机器人手的演讲。


孙宇同时是斯坦福大学访问教授、IEEE RAS机器臂抓取和操作技术委员会的始创主席,目前还担任美国总统国情咨询委员会机器人方向的顾问。


在演讲中,孙宇教授表示类人机器手十分精密炫酷,但是普遍存在的特点是造价高昂,最便宜的3万英镑,最贵的要十几万美元。然而,如果机器手要应用到普通人的生活中,实现工业化和商业化,那么就需要另辟蹊径了。


孙宇教授接着介绍了一些并不像人手的“机器手”,外形各异,但是能真正应用到各种人类生活的场景中。



孙宇教授以他的学术启蒙电影《终结者》举例,“终结者机器人”的核心部件包括两个:机器手和智能芯片。他所在的南佛罗里达大学RPAL实验室另一个主要的任务就是利用深度学习建造一个名为“面向对象功能的网络”(Functional Object-Oriented Network,FOON)的知识库,这个知识库主要是由计算机通过在线视频学习得来。通过这个知识库,机器手学习如何在面临日常生活中不同的物品时,判断使用不同的功能。



最后,孙宇教授借特朗普名言做结尾,鼓励大家“使抓取再度伟大”(Make Grasping Great Again)。


以下是孙宇教授演讲实录,为了给读者奉上最快的新鲜资讯,以下讲稿未经精编,稍后雷锋网将奉上更为精细的内容。  


孙宇:


很高兴在这里跟大家讨论一下机器人手的发展。在座的各位有谁能在国际象棋中赢得IBM深蓝的计算?有谁能在围棋中赢得谷歌的阿尔法狗?机器人在某些领域很大方面已经超过了人,但是机器人还没有一双灵巧的手。现在的问题是,我们怎么能给机器人一双灵巧的手。


在19世纪初文艺复兴时期,很多科学家和艺术家都开始研究人体自身,包括赫赫有名的达芬奇开始研究人体的解剖结构,达芬奇对人手也非常感兴趣。达芬奇在研究人手之后,为人手的复杂功能所震惊。因为我们的双手只占我们体重的百分之一,但是我们人体206个骨骼中,1/4的骨骼都在我们双手里面。我们的双手是非常复杂的机械结构,可能是人体当中机械结构最复杂的器官。


1993年的时候我看过一个电影《终结者2》,当时对电影里面的机器人可以做的事情感到非常惊讶。在这个电影里面,机器手和智能芯片被认为是最重要的两个技术,用来产生“终结者机器人”。在影片当中,英雄角色和他的母亲要毁掉这两项核心技术(机器手和智能芯片),同时要杀掉研发这两项技术的教授。


看完这部电影,我并没有对人类的未来充满担忧,反而脑子里觉得机器人非常的好,尤其对机器人手的灵巧性非常感兴趣。那个时候决定了我的梦想,我的梦想是要像电影里面的教授一样创造出第一个类似终结者的机器人。于是我带着这个梦想到美国学习,进入麻省理工大学实验室,在进入实验室的第一天我的梦想就毁灭了,为什么呢?因为我看到了这个名叫“Utah/MIT”的机器手,我的老师在很久以前就把我的梦想实现了,比我看《终结者2》电影的时候还早10年。慢慢的我了解了一下它的历史,它其实是由两位天才制造出来的。


1983年以后,有各式各样的非常多的类人机器手,这里我列了四项,都是非常有代表性的,第一个是德国的DNR和哈工大合作的类人机器手,第二个是NASA的机器手,第三个是最新出来的,第四个是比较炫酷的。这些机器手都像瑞士手表一样,设计地非常精致,机械部件都精准咬合,每一个都有十几个自由度,很多关节。同时,他们还有一个共同的特点,他们的造价非常昂贵,最贵的十几万美元。这些机器手在很多实验室当中已经演示了,他们可以做很多的事情,刚才大家也看到了一些机器人的录像。他们可以做很多类似人手的事情,可以做饭,可以做家务,日常生活无所不能。


其实,所有这些你们从视频中看到的机器手,大部分都是通过仔仔细细的编排和导演,通过很复杂的编程,花了很长时间使这些演示能在特定的环境和运动当中能实现。他们现在还远不能在复杂的环境当中得以应用。


刚才大家看到的机器手都非常的酷,但是在实际生活中很少见到这些机器手大规模的应用,不仅是因为造价昂贵,还是因为应用环境非常复杂。我们用工程的方法来解决工程的问题,我们有一些需要可以简化成工程的需要,通过这些需要可以找到工程的解决办法。好莱坞都认为我们的理念是可行的,他们有一个电影叫WALL-E,这个电影里面机器人的手跟人手没有什么相像的,它有三个手指头,跟人的手指头非常的不同。WALL-E可以做很多事情,至少可以在动画片里面换灯泡。其实,第一步复杂的编程并不是类人手的机器手,而是一个具有三个手指的机器手,以这个领域开始,因为各种各样的工程原因,以及各种各样的问题,我们可以看到有很多不同的工程解决方案。


其实在工业当中我们已经有很多的解决办法,并没有必要用机器手进行抓取。这是上一年的机器人大赛冠军并没有用机器手,用真空吸取技术打败了其他的团队。在这种环境下,美国的学者认为“抓取物件”这个问题已经解决了,但是“抓取工具并使用工具”,这个问题还没有解决。所以,剩下的最大的问题就是机器智能,我们缺少智能芯片。


随着科技发展,好莱坞也跟进了,在它的电影里面有一个智能中心,我们现在其实也有很多这样的智能中心,包括谷歌的智能中心。在我们实验室,我们发明了一个“面向对象功能的网络”(Functional Object-Oriented Network,FOON),这是用各种物体和它的功能及所用到的操作结合起来建了一个网络知识库。我会演示一下这个网络怎么建起来,这个网络通过看在线的视频,比如知道怎么做一样东西,把这个演示出来放到网上,通过处理,根据这个视频得出这个事情是怎么做的,用了什么东西,用了什么动作建了一个网络,相当于一个知识网络。这个知识网络合起来之后会建立一个很大的知识库,我们通过搜索知识库就可以得到想要的信息。比如说今天你晚上想吃烤牛排,跟机器人说,机器人就到这个网络里面查询,查询之后会得到一幅图,这幅图包括需要什么原料,需要什么步骤,整个画面的基本元素包括物体和运动。


当机器人做具体的任务的时候,很多的操作与其他的物体有实实在在的接触,比如说拧螺丝的事情,跟螺丝刀接触(在拧的过程中机器手受到不同的作用力)。同样的物体,做不同的运动,也需要有不同的力和部位,抓的时候需要用不同的手抓姿势。


我们做的是根据不同的任务总结出不同的要求,根据这个要求得到最优的手抓解决方案。比如说做锤子,轨迹是定下来了,需要做的是如何让机器手运动地较少。这幅图里,抓的时候机械手在运动期间要保证鼠标不掉出去,另外一个拧灯泡的例子,在拧灯泡的时候,这个灯泡跟灯座实实在在的接触(过程中产生不同作用力)。


我个人认为,机器人智能和计算机智能是两个不太一样的概念。


因为机器人要和自然环境有实实在在的接触,这是非常大的问题,是一般的计算机智能还没有涉及到的问题。我们今年10月份将在韩国举办一个抓取的竞赛,这里有很多的奖品,希望大家组队去参加。这里面我们发表了9个任务,都是要机器人实实在在与实体环境接触的任务。最后借特朗普的这句“名言”--Make Grasping Great Again,希望大家更好地来关心机器人灵巧手抓取。