人工智能(
AI
)很热,但很多时候我们觉得人工智能还不够
“智能”,比如说苹果手机,一家公司的创始人杨静前一段时间就把
Siri
卸载了,因为它不够智能,有时候还会添乱,一按它就跳出来,使得人工智能似乎变成了“人工智障”,感觉还不如不出现的好。
这就说明在人工智能技术的研发及应用方面遇到了一些技术挑战,很多专家都在自己深耕的领域对AI技术进行着自己的探索,很多探索是很超前的,那么,我们怎样才能跨越这样的艰难险阻,达到
AI
的一种新境界呢?
火爆下的隐忧
AI
这么火,一切的根源在于数据,庞大的数据洪流。我们身处在智能万物互联的时代,一切东西都联在网上,而且越来越智能,都在收集数据、分析数据。所以人工智能这个技术的关键性就在于怎么更好的把收集的数据挖掘、分析,然后利用起来,实现增值,从而带来增值的业务,这是大家如此关注人工智能的一个重要原因。
目前,人工智能还处在发展的初期。随着计算机时代的发展变得愈加成熟,很多技术的部署变得非常困难,因为很多技术都是在整个人工智能的框架之下的,但是在整个AI相关的领域当中,只有
7%
的应用才是符合
AI
的具体要求的。为了更好地实现人工智能,需要非常强大的计算能力才能够处理如此大型的数据。预计到
2020
年,用于人工智能的计算循环将会增长
12
倍之多。
英特尔的执着
大概在一年之前,英特尔收购了人工智能公司Saffron Technology。
Saffron
是
AI
领域平台服务的佼佼者,他们特别关注在基于技术的逻辑和推理的处理能力,非常关注数据的分析,同时也希望能够加入大家对于数据的理解,比如说对于欺诈的分析及其在银行业当中的具体应用,很多成功的案例都是在
Saffron Technology
的推动下得以完成的。近期,该行业巨头又收购了
Nervana Systems
。
对于这次并购,英特尔公司副总裁,数据中心事业部数据中心解决方案部门总经理
Jason Waxman
表示,
在这次
Nervana Systems
的收购中最激动人心的一点是,我们认为这家公司是符合我们的战略思路的,尤其在解决方案的初期一直到整个软件基础设施的构架,同时可以增加我们的数据库,并助力我们半导体的优化。因此,我们通过这么大量的
IP
的收购,最后将整个产品组合买下。这个收购结束完之后,我觉得在前
90
天我们就已经把这种非常好的技术进行了破壁式的发展,我想这也是增加了英特尔的处理和战略的能力。
与此同时,英特尔还并购了Movidius,这项收购案尚未完全完成,但是完成之后这项收购对于推动智能设备的发展将会非常关键。
Movidius
在嵌入式计算机领域是非常关键的,英特尔将会在智能照相机和图象识别,以及物联网领域都使用
Movidius
技术。因此将会持续扩大其在这个领域的投资。
Jason Waxman
表示,
构建基于英特尔架构的涵盖至强处理器、至强融核处理器、
Nervana
平台和
FPGA
、
Omni-Path
网络、
3D XPoint
存储等技术的硬件平台,结合英特尔针对深度学习
/
机器学习而优化的英特尔数学函数库(
Intel® MKL
)、数据分析加速库
Intel® DAAL
)等,和致力于为多节点架构提供卓越性能的开源软件框架,如
Spark
、
Caffe
、
Theano
以及
Neon
等,及可推动前后端协同人工智能发展布局的
Saffron
、
TAP
、
Nervana
系统、
Movidius
等工具和平台,以上这些产品组合可帮助企业更方便地获取、开发和部署人工智能应用,将人工智能潜能在各个领域充分释放,如智能工厂、无人驾驶汽车、体育、欺诈检测、生命科学等。
技术的创新机遇
现在技术的发展日新月异,我们看到大量的创新和新的改革。有些技术其实已经存在有几年了,现在正是开拓新市场机遇的时机。
机器学习
机器学习有不同的理念和观点,通常就是指从数据当中学习的方法,它能够构建这些数据,并且通过数据改进自己的性能,包括如何从数据当中进行系统化和架构的学习,这是非常宽泛的一个定义,并且这个概念在学术界已经存在很久了。直到最近,生活和工作当中能够产生更多的数据,因此就推动了机器学习的需要。
机器学习有三种不同类型,Nervana Systems公司的前
CEO
、人工智能专家
Naveen Rao
表示,对此,我不能说只有这三种类型,但是这可以让大家稍微了解一下机器学习的世界。我们在最近的许多新闻当中可以看到一个叫做监督学习的概念。比如说我有一些图片、标识,这个标识是贴在我的数据上的,例如一个人的面部识别,这个数据的标识就代表他的名字,这个名字可以联到计算机当中,计算机就能够学习,或者将这种输入的数据,将它的名字和图片连在一起。非监督学习则处于我们的技术前沿,很难去真正找到具有潜在的、可使用的一种数据架构,而且前提是你一开始还不了解这个架构的详情。
如果你想学一种语言,你先要听它,了解它的发音,了解语音语调,至少要形成一个语言的框架之后才能开始真正学习这个语言。事实上,我们很难赋予机器学习这项能力,但是我们还在不断推动这方面的研究。
接下来
讲一下强化学习。就像培训你自己家的宠物一样,你希望它有一个正面、你想要的反映,如果它给了负面的、你不想要的反映,你就要惩罚它,这就是强化学习的概念。我想真正的
AI
不仅仅是这三种类型。而事实上,让我们的生活、我们的世界更加好也就是机器学习和人工智能的最终目标。
举一个例子,是非常传统经典的机器学习。这里可以给大家看一些图片。大家可以看到这是我们其中的一个创始人,我们如何教会机器能够识别人的面孔,也就是说,让机器将名字和面孔连接在一起。按照传统方法来说,我要看一下他面部的特点,也就是眼睛和眉毛的宽度和鼻子的长度,这些都是非常重要的辨识特点,通过软件进行辨识,把它变成一种图像的关键点,我们把它叫做面部识别特点的函数。
最后我们通过不同的分类器,和一些集成的方法,最终能够辨别出他的名字。我想人类或者是动物能够更好的辨别这个面孔,但是机器需要很多的学习,因为它们没有办法直接提取出这些特点。传统的经典机器学习就是以这种方式进行面部识别的。
机器能力向人类看齐
未来,要想让机器具备像人一样的能力,这个能力体现哪几方面呢?英特尔中国研究院院长宋继强先生将其概括为四大能力:首先是感知外界环境的能力;二是根据感知来的能力进行推理;三是推理形成一些决策触动机器做反馈,这个反馈可以是动的,也可以是不动的,比如说视觉的反馈、声音的反馈;最后一个更重要的是能适应环境,要能根据环境的变化,交互的人的变化去相应的做适应,这个非常重要,要不然就会变成一个死的程序。
这里面有一条横线很重要,“记忆”,记忆是一个非常突出的重点。
Jeff Hawkins
,就是
Numenta
的创始人,他写了一本书叫《人工智能的未来》,就是专门讲人工智能或者说智能怎么去看待他,其实就表现在能够利用记忆去进行预测,如果能做到这一点,这个机器就真的有智能了。所以记忆这个能力非常重要,我们现在看到很多做人工智能的厂商也都把这个加入到系统方案里面。
深度学习
深度学习的好处是深层的,这样可以在很多不同的抽象层提取特征,而这个特征不是人去定义的,以前很多做人工智能和机器学习的人是去找Future,所以有
Future engineer
的工作,但现在可以不需要了,它可以让特征是自己从数据中发现,并且通过越来越多的数据提升系统的性能,而不是靠一两个
Future engineer
。
同时,深度学习也越来越具备强大的表示能力,从原来只能表示静态的图像和简单的语句,到现在有能力去表示连续的图像,也就是视频,甚至加上多模态这种方式。深度学习是一种突破性的技术,它的突破表现在在数据足够大的情况下,已经可以在某些层面超过人的能力,比如说在做人脸识别方面,在ImageNet上面已经超过了人的能力。在语音方面,语音识别、机器翻译也都达到了让人满意的水平。所以,随着计算量和数据量的增加,深度学习方面已经看到了巨大的突破。
我们期望性能随着数据增多而提升,同样数据多了训练时间也变长,当训练时间变长,一种情况下可以通过增加处理器的数量去扩展它的性能,让它仍然保持在一两天内可以把这个模型训练出来,如果处理器数量达到了一定程度,这个时候它的瓶颈不再是计算能力了,而变成了I/O能力,就是处理器和处理器之间通讯,或者是处理器访问内存的
I/O
变成了瓶颈,这个时候你再增加处理器的数量也看不到性能的增长,还是要那么多时间才能训练出来。
Nervana
技术就可以更高效的去定义内存的访问带宽和计算的密度,让它很好的去匹配现在的数据量增大的需求。同时可以让多个节点并行支持这种大模型的训练,所以我们可以看到近乎一种线性的性能扩展。
下图是一个基于张量运算的架构,张量运算是一个多于二维块状的运算,矩阵运算都属于张量运算。里面这些绿色的部分都是专门针对矩阵运算的处理单元。同时我们还用了一种叫Flexpoint技术,这个技术既不是定点的,也不是双精度浮点的,它其实是基于这两者之间可以变化的技术,所以在这个里面它可以提供前所未有的并行化的水平,计算密度非常高,是目前最好的一种硬件加速水平的
10
倍。