专栏名称: 钱皓频道
从VC视角观察互联网新趋势,分析背后原因与影响的新媒体分析平台,已有80多万互联网从业者与投资人关注
目录
相关文章推荐
酷玩实验室  ·  房租连年暴涨,美国打工人要被AI整破防了 ·  昨天  
国家数据局  ·  专家解读之三 | ... ·  3 天前  
国家数据局  ·  专家解读之三 | ... ·  3 天前  
51好读  ›  专栏  ›  钱皓频道

深度:人工智能和深度学习的下一个风口在哪(含22页PPT)

钱皓频道  · 公众号  · 科技自媒体  · 2016-12-02 18:09

正文


文:地平线机器人CEO余凯,来源:AI科技评论(ID:aitechtalk)


本文根据余凯在微软亚洲研究院召开的“让世界充满 AI-人工智能研讨会”上所做的报告《 “AI Inside”无处不在的未来 》编辑整理而来,在未改变原意的基础上略有删减。


我总在思考,如果当一个风口到了的时候,我再进入这个风口,我会没有满足感。


我始终在想,下一个机会在什么地方?它现在可能处于边缘状态,但我相信某个边缘的机会,会成为一个未来的机会,而这个未来的机会就是下一个风口。


这个思考过程非常痛苦,因为需要不断否定自己,去挑战自己,而且不被大多人理解。



2012 我们在清华大学以及百度内部推深度学习,别人会质疑:投入这么大的资源去做这个事情是否值得。而现在,很多项目都是基于深度学习,并且应用非常的广泛。

这其实就是一个从边缘到中心的典型案例。


我继续在思考,是不是该到边缘去,看看将来有没有机会成为撬动世界的力量。这就是我的 AI Inside,之前有个概念叫 Intel Inside,它创造了摩尔定律,撬动了整个 IT 产业。


2002 年我在微软实习,当时我、何晓飞、颜水成是团队里为数不多较为关注机器学习的人,因为志同道合我们就成为了好朋友。有意思的是,之后我们三人里面,我创立了百度深度学习研究院,晓飞创立了滴滴研究院,而水成则创办了 360 人工智能研究院。


驱动人工智能进展的三大因素


我认为驱动人工智能的进展主要有三个因素:



大数据:线下的数据不断线上化。


大算法:深度学习和增强学习的发展,深度学习用来感知、处理信号,增强学习则做于决策。二者相辅相成。


大计算:按照摩尔定律,2030 年一千美金买到的计算资源跟人脑相似。当然,现在英特尔宣布摩尔定律开始变慢。所以预测没法这样下去,另外一方面,从宏观上讲,对处理器架构的改版不仅仅是工艺层面,架构的变化也为计算带来变化。



深度学习为何取得成功?


从统计学习理论角度讲,分析一个学习算法的性能一般用推广误差来分析它。如果我们对推广误差的来源做分析,我们就能找到更好的方法去控制算法中一些不恰当的地方,以便找到更好的手段。


这其中有一个经典的统计角度分析方法,就是把推广误差分解为:近似误差(Approximation error) 和估计误差(Estimation error)。



近似误差(Approximation error)主要会做一些假设,由于假设的不完美,所以带来了近似误差,另外一种由于数据的不完美,所导致估计误差(Estimation error)的出现。


这样分析存在一个问题,就是你假设的计算资源是无限的,所以可以得到这样一个分析的结果。但从计算机科学的角度上来讲的话,我们会考虑计算的不完美,所以引入第三个误差:Optimization error,也就是算法。



考虑到计算的不完美,我们得到一些引导。


Model Class Bias:我们用大模型,模型越来越大,Bias 就越来越小。


更多的数据。


设计一个合适的算法。


深度学习处于一个非常幸运的区间,从统计性能来讲,他的 Model Bias 很小,但从计算效果来讲,它可以看到大数据。



这是一个很幸运的事情,过去深度学习在视觉和语音上有着很多的应用,而在互联网行业中主要应用在搜索和广告中,当然,机器人也是一大落地方式,深度学习在机器人的作用主要在于决策。



深度学习成功应用的案例


在百度期间,我们利用很大的模型和 1000 亿个训练样本,去改善搜索引擎的检索,比谷歌的 Ranknet 早两年。



包括在数据中心用深度学习改善运行效率,把 PUE(评价数据中心能源效率的指标)降低,这比 Deepmind 今年做出的结果早一到两年时间。 



除了这些以及自动驾驶外,深度学习还能提升广告收入。这是百度当年的股票曲线:



图中那个节点,是百度对外公布基于深度学习的百度蜂巢网络(广告系统)的节点。

刚加入百度的时候,我在自我介绍环节提到,希望在两三年时间内让外界在讨论 Google 人工智能时也会讨论百度。



站在今天这个时间点上,我想跟大家分享。


深度学习很热了,它的下一个机遇在哪儿?


我的回答是: AI Inside。


过去我们在云端部署算法和服务,但是现在有个机会是,把运算放在嵌入式和前端中。


比如是否可以在前端实现语音识别?这样在跟太太说的话不一定要传在云端里面,隐私能更好保护,体验更好。


再比如说在自动驾驶,如果有个小孩子突然横穿马路,传感器需要把这个信号传送至云端,然后做决策,但如果这个时候网络信号不好呢?


这就涉及到如何在前端嵌入式地解决人工智能的问题。


(颜水成博士曾在雷锋网承办的 CCF-GAIR 大会中提到,如果将运算任务直接下发到智能设备终端上,这些瓶颈就会迎刃而解。但是,把运算载荷放到设备上,显然要克服诸多问题。其中最大的一个就是:终端设备的运算能力存在天花板。由于智能设备成本有限,大多不可能配备顶级运算芯片)。


在中国有很多应用场景,中国每年需要新部署一亿的安防摄像头,大概到 2021 年,其中 30% 的是智能安防摄像头。这就必须要求低功耗,如果功耗很高,在阳光照射下,温度能达到 70 到 80 度,这种情况下就不能很好地处理计算。



平均每辆自动驾驶汽车拥有 8 到 10 个摄像头,再加上传感器、雷达、激光雷达等等,每一秒产生 TB 的级的数据,这种计算怎么去处理?



孙正义预测,2040 年会有 100 亿个机器人,当然这种机器人指的是广义上的智能机器,而不仅仅是人形机器人。


历史总是在不断重复,首先是 Enabling Technology Businees ,然后是 Technology Tnabled Business。



前者卖的是技术本身,当这些技术成熟后,一些公司做开发直接采用别人的技术,在这基础上,这些公司卖的是其他产品。


互联网时代,思科的市值一度高达到 3000 亿美金。虽然当时我们不知道互联网有什么用,但得先铺好网络,等网络铺好后,在这上面出现了 Google、Facebook 这些应用。正如图中显示,谷歌在后面成长起来。



移动互联网,虽然不知道移动应用在哪里,但移动网络需要 CDMA,铺好后苹果成为了巨无霸。


过去三四年时间,有个规律正在发生。


2011 年谷歌做大规模的深度神经网络训练,最后识别出猫脸,其实这件事是失败的。当时他们相信用 CPU 可以做所有事情,后面 Jeff Dean 意识到做神经网络训练用 CPU 是错误的。在百度,我们大规模用 GPU 做深度学习训练,在 2014 年,我们和微软都意识到 GPU 只适合做训练,不适合推断和预测,所以在大规模部署FPGA。今年我们也看到了其他产品如 TPU 和 BPU。



我再给大家看一个曲线,这个曲线是我一个礼拜之前画的:



这是英伟达的股价曲线,从去年七月开始到现在涨了四倍。在全球所有的高科技公司里面没有一家可以像它一样如此高速成长。为什么?现在无论 AI 大公司还是小公司,总需要买 GPU 训练模型。这就是 Enabling Technology 先行,Technology Enabled Business 顺势崛起的一个典型案例。


地平线正在建立一个软件和处理器的深度神经网络平台,让上层应用的表现有 1000 倍的提升,不是跟 CPU 比,我们是跟 GPU 比。




我们面向的应用场景主要包括自动驾驶和智能家居。


和英伟达的业务相比,他们的工作区域是在 20 瓦到 300 瓦,地平线的目标是 0.5 瓦到 5 瓦,他们的核心竞争力是价格优势和服务,我们的定位策略是芯片+算法、解决方案和设备。



一直到今天为止,谷歌和百度的无人车在测试时每行驶一小时就需要在树荫下休息,知道为什么吗?因为要散热,无人车的功耗是非常大的。




假如我们涉及处理自动驾驶这样一个计算,跟英伟达的计算相比,我们的不同在哪里。


地平线的优势在于我们跑这个运算时少于 1 瓦特,但他们用了 100 瓦特,这就是我们之间的区别,也是地平线机器人正在做的事。


余凯:十年后,AI Inside无处不在


来源:造就(ID:xingshu100)



“无处不在的AI Inside”。我认为在未来,我们用的所有产品,可能都是AI Inside(智能的内在)。

 
Robot?机器人?傻傻分不清楚


我们已经在不知不觉间进入到一个新的时代,这个时代叫“人工智能的革命”,或者叫“机器人的革命”。

回顾人类历史,有过三次产业革命:第一次是蒸汽机时代带来的产业革命,第二次是电气时代,第三次是信息时代。

这一次人工智能的革命,让包括我在内的很多人感到激动不已。

在我看来,前面三次的革命实际上都是以人为中心,延展人的体力和脑力。它让人可以跑得更快,飞得更高,看得更远。

人工智能的革命体现则非常不一样。我们看VR、AR,感受到的是一个虚实融合或者虚跟实没有明确界线的世界。

现在坐在我对面,跟我下棋PK、可以自主做决策的是AlphaGo。未来我们会看到更多自主开车、自主飞行,甚至自主地跟你讲故事。



它已不仅仅是以你的体力和脑力为延伸,它可以自主做决策。这样一个尤其鲜明的特征,实际上就定义了在新的世界里,有一个可与人类共存的物种。


说到这个物种,“Robot”在中文语境中被翻译成“机器人”,我认为这是有一定偏差的。这种偏差可能会让我们在创业、制订课题、投一个项目的时候,产生误解。

《剑桥字典》对“Robot”的解释是:Robot是一个在计算机的控制下,可以自主去完成一定任务的机器。它实际没有人的概念,Robot是智能的机器。


这里不得不说“安卓”这个词,英文里叫“Android”,它不只是一个品牌,它有具体的意义——长得像人的Robot,所以Android实际上是机器人。

未来的世界里,还会有很多很多Robot,有一部分是Android,但绝大部分Robot不一定长着人的形状,却有着智能的内在能力,就是AI Inside。

这个白色机器人叫Pepper,由孙正义的日本软银集团和法国Aldebaran Robotics研发。它是一个有自主反应的机器,而且长得像人形。所以它是一个Android,当然更是一个Robot。


日本大阪大学的石黑浩教授,专注于制造人形机器人。他每年都会来到中国,展示他的一些机器人作品,像这样长得非常漂亮、惟妙惟肖的美女机器人。

对背景知识稍有些了解的话,你会发现,实际在舞台后面某个小房间里,有个小女孩坐在电脑前控制着这个机器人,控制着所有的人机交互。你与机器人对话,回应的都是那个小女孩所做的理解,并非机器本身。

所以这个东西我能叫它“机器人”吗?它其实跟木偶没什么差别。
 

谷歌发布的Google Home,亚马逊的Echo,Misa展示的他的桌面机器人Rokid,它们能够自主跟人交互,甚至帮助你完成一些任务,它们都是Robot,但长得不像人,所以它们不是Android。
 
未来无处不智能

现阶段应用领域,我们看到的大部分都不是Robot。比如汽车,基于我的操控,它可快可慢,可左可右,但它自己不会自主地做任何事情。

如果,我们在汽车或这类产品上装上传感器,装上处理器,结合智能的算法,未来它就能自主决策。它们都会变成Robot。



今天的无人机已经具有自主定位、导航、避障等功能;Nest Labs公司的这款学习型恒温器,可以自动控制暖气、通风及空气调节设备,让室内温度恒定在你设定的温度。

它们都具有这种AI Inside的特性。

所以我们的未来,实际上是无处不在的Robot,无处不在的AI Inside。

讲到智能,讲到Robot,通常我们会有两条路线:

一个路线是,我们去造这样的Robot,它具有非常敏捷的机械能力,并且长得像人的样子;

另一条路线是,不断地提高它的智能水平和能力,以及它对知识处理的能力。


以人类和人类的近亲为例,猩猩的骨骼比人类更强大,肌肉也更发达,甚至更加的灵活,但它现在只能生活在丛林,找香蕉果腹。而人类不断地拓展自己的知识境界,已经在征服宇宙、太空。

这里面的差别在于什么呢?相较于猩猩强健的骨骼、灵活的躯体,人类拥有非凡的大脑。

大数据和深度学习的力量

与惊动世界的、AlphaGo第一次打败人类最强大围棋手信息发布同期,也是谷歌的新闻,谷歌打算卖掉旗下一个名叫Boston Dynamics的著名子公司,该公司是世界上最先进的人形机器人开发公司。

资源庞大如谷歌,它更愿意去开发像AlphaGo或是Google Home这样具有非凡大脑的科技产品,而不是有强健体格的人形机器人。

为什么会有这样的选择?大脑系统是机器人的关键。


大脑的系统里面,具有感知、认知、决策这方面的能力。比如感知,它的本质是算法,在过去的十年时间里面,不断推动算法进步的实际上是深度学习技术。

深度学习是从模仿大脑神经系统最简单的单个神经元开始,去构造一个更加复杂的网络结构。通常它们有分层的结构,还有前后时间序列的结构,使得它能够处理复杂的语音识别问题和图像问题,包括AlphaGo下象棋的问题。

数据大爆炸时代,深度学习正逢其时的主要原因是,深度学习与传统算法相比,更加适合大数据。在数据不断增长的时候,效果得到不断地提高。
 
以AlphaGo为例,它在上一次战胜欧洲冠军的时候,还只是职业二段的水平。经历四个月的自我对决,产生几千万盘的棋局的数据,再通过这些数据训练系统,使得它从二段跨越到远高于九段的水平。


事后媒体披露,就在它跟李世石比赛之前,用最新系统和当时职业二段所用系统来比的话,让四个子,它还能赢。要知道,职业九段如果让四个子,他是根本赢不了职业二段的。

这就是大数据和深度学习的力量。

今天的深度学习已经从感知进入到决策时代。这个决策的核心框架就是我们所讲的增强学习。增强学习要解决的问题是,怎么样连续做决策,以期优化你的长期收益。
 
构建人工智能大脑系统   

过去,我们看到互联网和云计算的强大,把所有计算都放到云端。但是这样有一个问题,自动驾驶时,突然前面有一个小孩横穿马路,你该怎么办?把信号传到云端,等待处理以后再做决策,万一网络不行呢?更好的架构是云端与本地相结合。

提及本地实现、云端实现,我们一定会谈到处理器。CPU?通用处理器?我们要说的是人工智能芯片这种特殊的处理器,专门处理感知、认知和决策控制的问题。

为什么大脑芯片不用通用处理器,而需要专用处理器,人类的大脑就是“通用处理器”啊?我们有很多的理由可以告诉你,人类大脑其实是“专用处理器”。


过去很多人问我,地平线机器人为什么要做人工智能的处理器?这是一个挺难回答的问题,但是最近看新闻,说谷歌也在做人工智能的处理器(专用的深度神经网络处理器),而且已经做出来了。这还能成为问题吗?

“地平线”希望去构建这种人工智能的大脑系统。基于这个处理器和操作系统,它会成为一个平台,以便让更多的开发者和公司,在上面开发各种各样的人工智能应用,包括语音、图像、自然语言理解、对话、决策控制、投资、自动驾驶等。
 
目前我们思考的产品线主要在两个领域:安徒生平台,是一个通用的平台,主要面向智能家居领域;

雨果平台面向自动驾驶,它对性能的要求更高,而对功耗的要求相对较低。



它像实时的4G一样,能感知整个路面所发生的情况。在一个非常复杂的街区,它能够识别行人、骑摩托车的人,各种各样的车辆。自动驾驶可根据这个判断进行规划和控制。


这背后实际上是一个深度神经网络。基于单目摄像头,运行在一个芯片上面所实现的较强能力。
 
未来属于会做机器人的人

智能手机在移动互联网世界,从上到下催生了一个巨大的产业机会。它不光有芯片的应用,还承载了那么多的移动应用。未来会是怎样?

在我们看来,从现在开始,一直到2025年,10年时间,每个人的周遭以及你所使用的工具里,都会具有AI Inside设备。我们即将面对一个无处不在的AI Inside世界。

从体量上来讲,它会是智能手机时代所产生的经济体量的10倍以上。


“地平线”希望能够在成就未来的过程中,成为一个推动者,成为一个让整个产业升级的平台,一个驱动者。

所以在这样的一个未来,世界首先一定是你的,是我的,是我们的,是人类的。这个世界同时也是机器人的。

归根结底,未来属于会做机器人的人。