在清华大学“清华学堂计算机科学实验班”题为《人工智能的黄金时代》的演讲中,创新工场董事长兼CEO李开复对“人工智能”进行了深入浅出的讲解分析,在讲解中,这位机器学习领域的博士对人工智能追古溯源、引用知名商业案例,并结合Google等巨头的布局和调整,为受众勾勒了人工智能的框架、要素、商用领域和条件,并且强调了人工智能当前的瓶颈和对当前互联网市场的影响。
关于当前人工智能是否是春药笔者不作评论,我只是将其中涉及的一些知识点拎一下,挑出有启示的东西,方便大家进一步理解,李开复是大牛,很多概念解释的浅显易懂,值得学习!
人工智能的官方解释没啥内容,解释了也等于没解释,比如一种定义:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
李开复的解释还是比较形象的,基本阀盖了当前人工智能研究的主要领域吧,见下图:
但其实并不严谨,感知显然是指图像识别、语音识别及自然语言处理,决策显然对应着机器学习涉及的分类和预测,反馈显然是冲着自动驾驶来的,实际上,这三者是相互渗透的,你中有我,我中有你,比如感知中的图像识别显然也需要做决策,反馈中的机器人显然也需要感知,大家会意就行。
李开复在人工智能中重点讲了深度学习,似乎人工智能就等同于深度学习了, 那么什么是深度学习?
李开复的例子还是不够生动的,很多吃瓜群众仍然表示不理解,笔者就再来解释下,假设我们要确定⼀幅图像是否显示有⼈脸,如下图所示,我们要怎样做呢?
我们受到启发的⼀个想法是将这个问题分解成⼦问题:图像的左上角有⼀个眼睛吗?右上⻆有⼀个眼睛吗?中间有⼀个⿐⼦吗?下⾯中央有⼀个嘴吗?上⾯有头发吗?诸如此类,如果⼀些问题的回答是“是”,或者甚⾄仅仅是“可能是”,那么我们可以作出结论这个图像可能是⼀张脸,相反地,如果⼤多数这些问题的答案是“不是”,那么这张图像可能不是⼀张脸。
下图是⼀个可能的人脸检测网络结构,其中的⽅框表⽰⼦⽹络,注意,这不是⼀个⼈脸检测问题的现实的解决⽅法,而是为了帮助我们构建起⽹络如何运转的直观感受。
子网络也可以被继续分解,这看上去很合理,假设我们考虑这个问题:“左上⻆有⼀个眼睛吗?”这个问题可以被分解成这些⼦问题:“有⼀个眉⽑吗?”,“有睫⽑吗?”,“有虹膜吗?”等等,当然这些问题也应该包含关于位置的信息 —— 诸如“在左上角有眉⽑,上⾯有虹膜吗?”——但是让我们先保持简单,回答问题“左上⻆有⼀个眼睛吗?”的⽹络能够被分解成:
这些子问题也同样可以继续被分解,并通过多个网络层传递得越来越远,最终,我们的⼦⽹络可以回答那些只包含若⼲个像素点的简单问题。举例来说,这些简单的问题可能是询问图像中的⼏个像素是否构成⾮常简单的形状,这些问题就可以被那些与图像中原始像素点相连的单个神经元所回答。
最终的结果是,我们设计出了⼀个网络,它将⼀个⾮常复杂的问题 —— 这张图像是否有⼀张⼈脸 —— 分解成在单像素层⾯上就可回答的⾮常简单的问题,它通过⼀系列多层结构来完成,在前⾯的⽹络层,它回答关于输⼊图像⾮常简单明确的问题,在后⾯的⽹络层,它建⽴了⼀个更加复杂和抽象的层级结构,包含这种多层结构 —— 两层或更多隐藏层 —— 的⽹络被称为深度神经网络,也叫作深度学习。
李开复针对深度学习特意引用了下面一张图,经过上面的解释,就一目了然了,从底下开始先识别边缘棱角,再到局部特征,再到人脸,如果再往上抽象,就可以识别具体的人了:
以上提炼特征的过程实际就是无监督学习,也就是我们在训练的时候是不需要带标志的样本的,一般的机器学习往往需要根据人的经验去选择特征,比如根据正负样本来删选显著特征变量,深度学习则是自己学习特征,比如首先识别出边缘棱角特征,接着将这些边缘棱角作为输入去构建出的更上一层的局部人脸特征,然后再抽象出更上层的完整人脸特征。
有了这些自学习出来的特征,就可以去做有监督学习,这就是常规的机器学习的套路了,将最终的特征通过一个分类器去识别具体的人,假如标志样本数据足够多,分类的就越好,准确率就越高。
关于深度学习的挑战,李开复提了四点,分别是平台化、数据、计算及可解释性,并且提到人工智能的黄金时代已经到来,比如芯片领域、金融领域、视觉识别领域和无人驾驶领域都是创新的明星。
关于平台化,李开复认为当前深度学习门槛还太高,大多数人要使用还不具备条件,不像I O S,安卓的平台那样好用,也提到诸如TensorFlow等还算不上什么平台,言下之意是人工智能平台必须要普及才能有井喷效应。他提到一定要找一批特别聪明的人,让他们不断的调节算法,搞出大的人工智能平台,这也是Google等公司当前高薪找顶尖人才的原因。
笔者觉得Google等公司现阶段主要是为了搞应用创新,深度学习平台要像IOS等平台那么好用也不现实,其是数据和算法的结合,就好比数据挖掘,你扔一个SASS工具给一般人,大多数人仍然没办法做成啥事,一没数据,二要调参,这个门槛是很高的,人工智能的平民化、平台化真得可能吗?
吴军在《智能时代》书中提到,只有很少人才能赶上这一波,其实不大可能有普及大众(包括一般程序员等)的此类深度平台的存在吧。
关于人工智能可解释性,既然生物科学现在还没法解释大脑神经元的运作机制,就没必要纠结了,知道相关性能解决问题就可以了,要理解其因果关系就好比要求能够测算出随便扔的一个球停在具体哪个位置那么难。
笔者倒觉得最大的挑战是应用和数据,比如机器学习最大的应用领域是广告和金融,但似乎深度学习的差异化优势并不明显,同时大数据还处于起步阶段,采集设备价格不菲,数据共享任重而道远,还不足以支撑起深度学习需要的数据需求,人工智能黄金时代的提法为时过早。
除了计算、平台及人才外,李开复特别提到了要拥有垄断性的大数据,包含二层意思:
一是只有我有,其他人都没有,同质化不可能形成差异化优势,这是大实话,理解这一点,大家就能理解为什么BAT不可能开放数据。
二是无标签的数据也不会给你带来优势,如果是人工标签的数据也不行,因为人工标签太慢了,最好的数据是闭环的数据,所谓闭环的数据就是在你应用的时候可以捕捉到数据并且知道最终你根据数据做出的抉择对或不对。
比如淘宝的订购数据,除了流水天然就有结果标志数据,代表买还是不买,这就有价值,又比如当前的运营商的URL数据,如果URL没有标签或者标签完全靠人工打造,数据的差异化优势就不大,我们必须通过爬虫、自然语言识别等方式去自动为这些URL赋予标签含义。
笔者以前也说过,运营商的数据最多是页岩油,开采的代价是很大的,现在还要加一句,必须依靠机器去为这些数据打业务标签,才能形成差异化优势,现在诸如APP洞察报告很多了,但APP的识别大多还是人工识别的产物,真实的业务价值不大,如果APP能自动识别了,这个数据才叫有价值。
李开复提到了不要用人工智能去取代人、要聪明的找到容错的用户界面、让用户提供自然的大数据及关注局限领域四点。
关于人工智能更多的是辅助人而不是取代人,其举了一些例子,比如写深度文章还是需要人的,创造机器人的高明医生还是需要的,但这个其实自相矛盾,现在我们很多工作性质就是辅助性的,必然会取代很大部分人。
关于容错的界面,其举了个百度查询结果的例子,其实跟大数据的一些观点差不多,比如传统数据处理追求“精确度”,这种思维方式适用于掌握“小数据量”的情况,大数据纷繁多样,我们不再需要对一个现象刨根究底,只要掌握大体的发展方向即可,适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。
关于让用户提供自然的大数据,其实是在探讨大数据搜集的方式问题,其举了个Siri的例子来表明苹果靠Siri收集了很多人的真实语音,收集了大量数据,有利于进一步提高人工智能的能力,这个其实跟工业4.0等的想法类似,没有数据也要创造条件搜集数据,从而提升服务水平。
关于关注局限领域,其举了谷歌全天候全路况的无人驾驶例子,认为起步的时候野心太大也不一定好,可以先在可控环境下的进行商业驾驶尝试,比如无人驾驶叉车取代了一个叉车工人去开叉车,技术难度相对低,也不用担心政府的法律法规。
最后,李开复给出了人工智能的未来蓝图,全局视野比较好,的确带来有一定的启示,大家可以看下图:
向大师学习!
End.
作者:傅一平 (中国统计网特邀认证作者)
本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。