专栏名称: 算法与数学之美
从生活中挖掘数学之美,在实践中体验算法之奇,魅力旅程,从此开始!
目录
相关文章推荐
九章算法  ·  9月LeetCode刷题小分队正式开始啦:刷 ... ·  6 天前  
九章算法  ·  变天了!亚马逊RTO+裁员组合拳,真相来了… ·  6 天前  
51好读  ›  专栏  ›  算法与数学之美

真实户外场景中能够应用的机器人系统

算法与数学之美  · 公众号  · 算法  · 2017-07-08 21:56

正文

本文为金出武雄教授在全球人工智能与机器人峰会的演讲分享。


演讲前,主持人杨强教授对金出武雄教授做了简短的介绍。

首先我们知道机器人是大家非常关注的人工智能的一个领域,在学术界已经有过很多年的研究,机器人这个技术到底能不能落地,在实际的场景中到底需要哪些创新才能够为我们所用,我们今天来听这个方面的鼻祖级专家,他是卡耐基梅隆大学的创始人,同时也是非常著名的荣誉教授,他主要研究是在机器人工、机器人学,都是在全世界独领风骚的指路者,是著名的金出武雄,有请。


金出武雄教授的演讲主题为“在真实户外场景中能够应用的机器人系统”。

以下为演讲精华摘要。


今天我要给大家讲的主题是在真实户外场景中能够应用的机器人系统,我为什么要讲这个主题呢?因为我觉得智能不光是用来玩游戏还是信息处理,实际上真正的智能应该是在真实的环境下跟人类进行互动,所以我们应该有这样的智能机器人的系统。


首先我给大家介绍我最近的一些学术研究,在晚上开车的时候,大家有没有注意到,雨滴在我们的窗户上会形成一层薄膜,它会阻挡我们的视野,为什么雨滴在我们看来会成为我们遮挡视线的障碍物呢?首先这是因为如果我们从透明的角度去理解雨滴的话是透明的,不会影响我们的视线,但实际上我们的车灯在发光的时候,打到了雨滴上面。当它遇到雨滴的时候就变成了一个迷你镜头光,光会在里面折射,会影响我们的视野,这也就是为什么雨滴会成为我们的视线障碍。再举个例子,如果我们的汽车或者是我们的玻璃,要成功阻挡雨滴对我们的遮挡要怎么做呢?答案是如果我们看到雨滴在降低的过程中,我们把车灯换成投射仪,就像我们在会场用的投射器这样,如果车灯换成投射仪,在雨滴降落的过程中,我们的投射器把每一个雨滴进行投射,这样雨滴就变成透明的,就不会影响到我们车灯的视觉效果,因为它没有产生光的折射。而那些在雨滴之中形成的水汽将会在背景中体现出来,所以大家能够从投射仪的反面看到,所以大家会想这个场景是怎么变成现实的呢?是不是操作起来很困难?实际上操作起来比较简单,因为下雨雨滴的降低过程并不是快速的跌落过程,一般情况下是每秒10米的降落速度,虽然我们看起来好像雨滴降落得快,在计算机视觉或者是在照相机看来,他们的采集速度里面就会把雨滴看成是一滴一滴的物体,这样通过计算机捕捉雨滴,就要比人类捕捉雨滴更直接更快,同时我们还能看到,照相机和投射仪器的像素不光能够接受灯光和光线,同时在灯光不足的情况下还会产生闪光,这样就提亮了整个照片质量的亮度,如果我们把所有的雨拍照,我们能够在视线范围内看到那些雨滴在什么地方。这是一种很简单的办法,只要我们看到雨滴的位置,然后我们把相应雨滴投射出来的点进行控制,这样通过控制它投射出来的点来控制雨滴,这些雨滴就不会阻挡我们的视线,而这个速度可能是很快的,在试验测试过程中就可以成功组织这些雨滴迅速下降,阻挡我们的视线。实际在真实场景中要拍照片然后发现这些雨滴在哪里,去进行控制是要花时间的,当我们准备好的时候,实际上雨滴已经发生了位移,当我们拍照的时候确认的位置在它之上,而现在雨滴德威治已经发生了下沉,所以在真实的场景中雨滴还会比我们看到的时候更下沉一些。中间和偏下方由于光线反射的原因就很有可能造成危险区,我们就可以去更好预测到底这个射向应该打上雨滴向上的地方,这样可以预防危险的预测,也就是高风险区、中风险区、低风险区,通过视线的这种方式,只需要根据雨滴的下降和位置,最终决定这个射线是否放出还是收回,这样可以让射线不会直接撞击或者折线雨滴,这样可以节约多少射线不会造成直接的反射,如果要保证射线不照射到雨滴上,你就只能把大灯关掉,但是关了大灯是无法开车的,这就是我们为什么要做这个工作。


那么我们到底应该怎么做呢?我们准备好了一个投影仪,同时还有一个摄像机,我们会进行同步的拍摄,用电脑对整个流程进行介入,我们用的就是会议当中的投影仪,进行相应的调整和修缮,因为现在大部分的投影仪都是使用DLP的投影仪,他们都是用比较小的镜面的序列,这样可以很快在每秒两百侦的数字上进行调整,所以大部分市场上买到的投影仪都没有办法达到这个水平,这就是为什么我们要对这方面的性能得以不断提升,这就是为什么我们要对投影仪进行相应的调整。我们就把它拿来代替试验当中的大灯,在前面我们放了一个摄像机,就像刚才提到的,放到一个透明的盒子里面去然后运输出去,把它放进车库里面,放在车的大前盖上,这样就有了一个新车,这个新车就有了一个全新的智能大灯。当看到智能大灯比如开始下雨了,在下雨的过程中你就根本不会看到灯,因为有了智能大灯你看不到雨滴,因为这个智能大灯可以有效智能的避免射线直接投射到雨滴上,对你的视线产生相应的影响。


如果你看到下雪,这是我们的人工雪的场景,雪的影像就会清很多,因为你的智能大灯射线并不会直接照射到雪花上,不会对你的视觉造成相应的影响。在很短的时间之内,我们可以看到它可以造成很高的视线清晰率的提升,到目前为止可能还没有那么多的人购买这种智能大灯的产品。但是,一旦我们能够了解到它背后的机制,也知道我们能够做这个智能大灯,我们就可以考虑这种智能大灯可以使用在很多的应用上,最简单的应用就是我们有高光线和低光线,比如说远光灯和近光灯的改变,比如你开远光灯视野很好,但是车跟你相对开过来就要把远光灯调成近光灯,否则就会影响到对方车辆的视线。在我这个年纪的人一般情况下如果受到远光灯眩光眼睛伤害的话是很严重的,也就是在开车过程中如果我们的眼睛受到了眩光影响后期开车就要闭着眼睛,这是非常危险的,这就是为什么现在有很多眩光造成的车祸事故。当然我们有这种智能大灯,不仅是把远光灯调为近光灯,不让射线直接投射到对向开车的驾驶员的眼球上,他就不会看到我的大灯了,可以看到车开过来,智能大灯会直接关闭掉投射到对方驾驶员眼球上的射线,这样对方眼球就不会出现眩光情况,而这样就好像是在对象的车上形成了安全驾驶,我们真正做到的就是从我们的角度不会把射线投射到对方驾驶员的眼球上,这样他们就不用进行远光灯和近光灯的调整。这样也不会影响到你后面行使的车辆,有些时候你甚至在远光灯的眩光影响下还会影响你的视野,我们要做的就是这种智能大灯的调整,大家可以看这个视频,这下面是驾驶员的视觉,你可以看到装上智能大灯就不会受到眩光的影响,同时从你自己的视觉角度来说,在上面可以看到你其实是开着远光灯的,而且前面道路视野也特别好,但是你对面来车的驾驶员不会受到远光灯的影响,这对我们本车驾驶员和对车驾驶员都是安全的。


一旦做到这一点就可以做很多有意思的应用,到目前为止,我们的自动驾驶车知道开到什么地方去,特别是乡村道路上,很多时候就可以探讨使用这种智能大灯,就可以直接告诉你行使的方向。或者目前很多自动驾驶的系统都可以直接检测到周围的人行道或者自行车,这种监测功能反应比人还更快,所以一旦系统监测到这种行人或者自行车的话,智能大灯就可以向这些行人或者自行车投射更多的灯光,让你可以清楚看到旁边有人,不要开车撞到别人,这样会保证更多的安全性,也有更多的应用。也可以把它直接放到我们的车上进行智能大灯的调整,你就可以拥有一个车前盖的大灯。可以看到这样的应用是很有意思的,可能看上去是一个创新,它把智能的应用,把电脑视觉的技术在大灯上得到应用,可以让我们的生活与众不同,提高生活质量,这也就是为什么在这里我提到我们要使用智能技术的最重要的点,创造生活更好的条件。


到目前为止我们有了增强现实,增强现实是一个非常非常有效的概念,当大家在进行手机的使用过程中,你可以从不同的角度使用增强现实技术,比如说像去年的PokemonGO游戏,或者你通过增强现实技术也可以更好了解到你现有的面前楼宇的具体情况,这到底是不是真正的增强现实呢?我觉得并非如此,我们所提到的如果我把这些增强现实的手机拿掉的话,我根本看不到这个游戏,也看不到这个大楼,但是真正能够做到增强现实的不是现实本身,真正能够做到增强现实的是通过显示屏本身所能够展现出来的关于现实场景的真实信息。当我去参加增强现实大会的时候让我做主旨演讲,我跟他们说你们大会的名字选得不好,后来他们主办方就不太喜欢我,这也是我开个一个玩笑,我觉得是通过LED来增强现实。


当我们提到机器人或者机器人的发展,事实上并不是专门针对于工厂或者其他的一些场景,它同时也可以使用在户外场景中,我们称之为实地机器人或者是户外机器人。它可以拿来做道路的勘探或者做道路的监测,这些户外机器人有些非常有意思的应用,因为他们是在完全不知道、完全新的户外场景中,他们对场景的了解比较少,今天我就简单介绍一下户外机器人的使用包括在卡耐基梅隆大学是如何做这项工作研究的,这个工作是我和我的同事一起进行的。


在机器人研究上已经有了很长的时间,从1980年开始就已经实地机器人也就是户外机器人的研究了。当时我们跟很多知名科学家合作,也有很多的明星科学家在这个项目中产出,同时我们把大量的机器人放到要求非常高的活动当中去完成任务,从历史的角度来看一下他们做了什么工作。一般情况下他们都是这种危险环境下来进行工作的,比如说回到80年代的时候,大家都知道我们当时有第一个机器人,这个机器人去到了3M岛的核电站,是在核泄漏地区做了环境监测,这是80年代做的工作。与此同时,我们还有一个机器人,这个机器人能够帮助我们去看这个活火山的情况,而这对于我们人类学者是上不去的,就用这个机器人去做活火山口的调查,这是非常有意思的应用。同时我们做了极地研究,能够帮助我们很好了解到极地的地况,因为在这种环境中,如果我们真正去到这样的环境,是一个非常重要的科学研究过程。但是我们都知道,极地地区非常广阔,而对于人来说不希望有太多的人介入的工作,所以当时使用了机器人。同时对于挖矿也是如此,我们现在也通过机器人帮助挖矿,同时进行户外开矿,这已经是在80年代就可以做到的。这种机器人的卡车现在已经完全实现了没有任何人的干预自动驾驶和环境当中的使用,事实上是在上个世纪就完成的,这也是我们自动驾驶的雏形,因为周围环境没有人,所以这种自动驾驶安全性比较高,成功性在前期就已经得到了验证。与此同时我们还有自动收割系统,这个机器可以帮助我们实现青蒿叶的收集,可以实现大概600英里的全时段作业,同时可以一次性收集200公顷以上的青蒿叶。所以可以看到,这也是我们早期的一些系统。


同时在卡耐基梅隆也做了很多关于自动驾驶的测试。我们在80年代中期就开始做了,有我们的Navlab1,那时候还没有电脑,还没有比较大的个人笔记本,只有一个大的工作站,这个工作站会有两到三个微型工作站,那时候就已经是非常先进的工作站了,这个蓝色盒子到目前为止,我们把它称为就像谷歌的自动驾驶车上的自动驾驶模块,那个时候尺寸还特别的大,当时在世界上只有三个做到周围环境的监测,那个箱子就超过了三十万元美商。当时Navlab1就有这样的设备,也是非常靠近我们的卡耐基大学,我们做了这个项目好几年。我们建了这个Navlab实验室,我们做了大量的试验和大量的无人驾驶汽车的项目。

   

我们做了而Navlab的一系列汽车,在美国的无人驾驶大赛上,Navlab5号自动驾驶了三千英里,完全是由汽车所控制的,二十年就可以做到了,我知道它是98.2%是由电脑控制,而不是100%由电脑驾驶。但是这点非常有意思,事实上自动驾驶并没有100%的驾驶水平,这是相对来说比较危险的,从我们的案例当中可以展示出,有一个人得一直在驾驶座上,像特斯拉一样,但是这个人不会拿手握着方向盘,这个人是把手举起来,让方向盘自己由电脑进行控制。不管这个人看到前方有任何的危险情况,他赶紧握住方向盘来进行自己的操作,我们经常也可以看到这种情况,有些时候大家在开自动驾驶车的时候,甚至是比你自己开还要累很多,因为你要随时注意路况,现在即使我们在研究自动驾驶汽车,这也是非常大的问题,对于这种四级或者五级的自动安全驾驶的系统来说,路况的复杂性仍然是比较大的问题。另外我的同事在2017年也做了一个试验,这是100%的自动驾驶,因为在驾驶员的位置上没有坐真实的人,而是完全由人进行电脑控制,这个试验里面他们全部用了电脑的程序来控制汽车的驾驶,但是现在还有一些自动驾驶方面的挑战,在我看来技术方面我们已经证明了无人驾驶是可能的,但在当时来看整个世界并不认为我们可以去进行人工不干预的自动驾驶。在后来人们开始逐渐接受并且自动驾驶的技术也开始在世界上进行广泛的使用,大家能够注意到在过去的20多年,世界逐渐开始接受这个技术,导致了今天自动驾驶技术的成熟和爆发。在路面测试的这种自动驾驶或者是挖矿的自动驾驶都是一样的。

   

另外我们还做过一些关于飞行器的试验,那是在90年代,我们有一个雅马哈的直行飞机,不光是无人驾驶,而且可以在空中做一些动作,大家看到上面的图片可以看到螺旋桨,实际上这个直升机在空中飞行的时候还可以做一些抓取动作,我们只是简单的在直升机上进行了磁铁的技术,就可以做一些复杂动作,它是100%进行自主飞行和无人驾驶的。当我们把其中的一个物品用蓝色去进行标色,在飞机上联系磁铁的时候能够自动的检测出蓝色包裹在什么地方,并且能够自动降低它的飞行高度,用螺旋桨进行一个调整。另外我们还会对包裹的位置进行调整来帮助直升机更好的用磁铁去把包裹抓取,整个的过程全部是通过无人驾驶和无人干预进行的,那是在90年代就完成的试验。

   

这些都是在过去我们关于无人机和无人驾驶的试验,但那是10到15年前的事了,而今天的试验成熟度和复杂度都提高了。首先就是我们的目的地在哪里,我们要去哪里,是要用GPS还是不用GPS,在今天的应用中GPS极大的帮助我们进行无人机驾驶,但有的时候在森林或者是在地下或者是在比较颠簸的环境中,GPS的效果就不是那么好。所以我有个同事,他是做导航系统,他是用IMU的系统,另外用计算机来抓取图像,然后来控制物体的飞行和移动速度,另外他们还装了激光设备。在90年代或者是80年代的时候,一个照相机可能就是这么大,而且价格不菲,但是现在的照相机可能都不到1000美金,而且体积也变得越来越小了,同时还有激光的设备在今天也是变得越来越小和成熟了,所以他就用这种新的导航系统来帮助我们探测物体的位置、移动和动态,并且能够根据传回来的数据创造出一个3D的实景图,一旦我们描绘出实景图的时候,就可以在图上做很多有趣的动作。大家看图像上这是一个试验,也是我的同事做的,他在草地上进行奔跑,跳来跳去,可以看到他的整个行动路径都全部被记录下来了,而且进行了3D还原,当他在草地上进行奔跑和移动的时候,整个动态环境以及他运动的轨迹都全部被描绘和记录了,而现在这种技术已经是完全可能的了。但是要想一想在15年或者是20多年前这种技术还是非常先进和前沿的。

   

另外我们还有飞行器,大家看这是一个无人机在飞行,在飞行过程中就能够自动的进行绘图,不光是户外进行飞行,而且能够在建筑物之下进行飞行。大家看它现在降低了海拔高度,穿过了建筑物,穿过了屋顶,在它的下面进行飞翔,然后在比较模糊的环境中继续飞行。整个飞行路径全部是自主驾驶或是无人驾驶的,我认为现在的无人驾驶技术已经变得越来越有应用空间,而且我们甚至能够在地下,因为在地下GPS的导航系统一般是没有办法工作的,我们就需要在这些飞行器或者无人机上安装传感器来帮助我们进行定位。我们现在看一个无人机是在地下矿区进行勘探,而且对地下矿区情形做了3D绘图,这项技术在今天已经变得很成熟,同时它的技术成本也变得越来越低。但是我想强调一点,户外的机器人或者智能机器人在真实的户外场景中进行应用,已经不再是想象了,因为我们现在有很多很多的试验已经证明他们的可能性,我给大家再举个例子,在农业机器人的使用,刚刚我在我的片子中讲到的,大多数的无人机或者飞行器都是进行导航,在飞行的过程中他们还要完成任务,一般情况下这样的任务都是进行导航,但是在真实的农业场景和应用中,比如说图片上的这个场景,我们就需要它进行一些高强度和其他的行为,比如说除了导航它还要去对整个植物的情况做勘探,比如我们需要这种无人机或者飞行器去抓取种植物的生长情况,比如说这些农作物长得好不好,有没有害虫,是不是已经成熟了,我们需要这些参数在无人机的信息抓取中提取出来,我们不仅想让他们看到这些植物,而需要植物细节的信息。所以我们还要要求这些无人机和飞行器对植物的成长状态进行分析。实际上人类的劳动是很重要的,而且很多人类的行为是无法被机器取代的,我们的智能系统能做什么呢?我们的智能系统就能够提供一些反馈,这些智能系统和无人机抓取的信息不会损害农作物本身种植的情况,因为由人去采集这些信息的时候就不可避免的会对植物造成影响。除此之外我们还可以看到整个的流程,还有果实的筛选、果实的包装、运输,这一切都是直接把它集合成为了一个智能系统,同时它能够帮助我们提升机器的最终收益。

   

最后想介绍我们的国家工程中心,简称是NREC,它座落在卡耐基梅隆内部,我们有一个机器人中心,是一个非常大的占地实体建筑,它是真正像仓库一样的实验室,而整个建筑都是专门针对于机器人研究的,当然不仅仅只是针对于研究,还针对机器人生产,在这里可以保证机器人研究和生产,同时机器人可以使用在实际生活中。在我们NREC的研究中,还有一个机器人生态系统,现在跟很多世界的知名公司和研发公司进行合作,来不断扩展机器人的研究。从环境角度来说,深圳是一个全新的城市,所以可能深圳没有这个问题,但是匹兹堡是一个历史悠久的城市,我们回到90年代初期,大家可能都不相信,匹兹堡当时是先进而且富有的工业化城市,但是大概是在10到20年前,匹兹堡现在已经成为了棕色地带,也就是受污染地带,已经进入到衰落时期。这就是为什么我们建立起了一个国家研究中心。这是关于国家研究中心的旧址,进行了修缮,作为我们的研究中心,我特别提到这个是因为那时候我还是这个研究中心的主任,这个中心刚刚建立的时候,周围的地区是大家不太愿意在天黑时候去的地方,因为很多人跟我说天黑以后不要去那个地方,非常危险,这个地方曾经是一个高危地区,这是二十年前,但是现在周围都发生了变化,变得非常棒,而且当时的房子只要10万或者20万美元,但是现在的房价都到了上百万,所以可以看到机器人的研究,不仅仅只是机器人研究真正能够帮助本地带来新的收入,并且建立一个更好的环境。事实上优步也来到了匹兹堡,他们也在本地雇佣了团队,建立了研发中心,现在优步在匹兹堡已经有了无人驾驶汽车,两年时间就做到了这一点,他们是从零开始的,但是现在他们和各个业界进行合作,实现优步的自动驾驶。

   

最后我想和大家说,实地机器人是非常有意思的事情,为什么说有意思呢?因为它是把我们的理论和实际紧密结合在一起。大家坐在这里不仅仅只是作为业界代表和学生来做小型理论的探讨,来说这种理论可不可用,因为如果只讨论理论,我们不知道这个理论能不能用。如果真的要践行一个理论能否能用,就只能用试验的方法展现给大家看,让大家了解到我们研究的方法在现实生活中是可以使用的,同时可以为社会带来相应的福祉,也可以看到从定义的角度来说,实地机器人可以实现真正的多人多学科包括多方面的合作。能够为我们带来更多的活动,就像在农业行业,大家可以设想整个农业的发展包括农业机器,有些时候我们觉得一些农业机器可用,但事实上并不是那么实用,我们要和农业的专家进行探讨才知道这些可不可以用,在全球环境里都是如此,我们要做不断的推广和研发,还有我们必须要诚实,有些时候我们在说一件事情,我们说A,但是我们觉得这个事情对社会带来好处,我们做过测试,但是对于测试结果要必须非常真实,把真实的数据给到社会,真正通过这样的诚实的力量,让大家真正了解到我们的想法,真正为这个社会带来变革,能够真正为社会带来进步。同时能够带来真实的设备和真实的机械机器推动社会的发展,因为从最终的角度来说,我们是希望这个项目或者这些新的研发可以转化为实际产品的。

   

未来的发展到底在何处?从我个人角度来说,特别在机器人的研发领域,我个人认为现在我们真的应该去设想一下,不仅仅只是想机器人的机制或者传感器或者算法,我们现在要真正关注的是整个集成性的机制、应用和其他技术,如果没有办法真正想到未来的应用,是没有办法做好现有研发的,这就是为什么我们要有整体系统,这个整体系统需要我们进行不断的研发,需要我们不断的前进。我希望大家能够认同我的观点,同时让我们一起携手创造这样的完全系统,能够真正为世界带来贡献,这样我们的人工智能和人工智能系统能够真正成功,不再只是一个口号,最终能够带来一个实际的系统,推动社会的进步,谢谢大家。