当我们描述这个特征的时候会变得非常困难。我们就拿图像识别举例子,在这 20 年里,我们有两类论文。
第一种,找到不同的特征描述图片,发现新的计算特征使图像识别更加准确,可以发论文。第二种,基于不同的特征,研发识别算法也可以发论文。
在两个领域里,一个领域要去找特征,一个领域要研究算法,都可以提高生物识别图像率。但是整个效果非常有限,第一波跌下来了,第二波起来之后效果也不好,图像识别一定比人差。第二波人工智能也没有取得成功,研究人工智能的教授出去会说我是搞计算机的,不是搞人工智能的。
2000 年是一个大的时代,开始进入深度学习的时代。
这算是什么时代?源头是 2006 年一篇论文,大家从原来的算法走向了神经元的方法,之后的一个突破是百度的首席科学家。
一开始是找猫的系统,识别人脸和识别猫很难的一件事情。一千万张图片里,有的图片有猫,有的图片没有猫,大概用了1.2万个CPU计算核心,每张图片不是按照猫耳朵、鼻子图像提取特征,每个猫是200×200点阵,4万个初始的数据输入进去,给了一千万猫的照片,我们叫标注数据,有的照片上面写了这里面有猫,这里没有猫,再给计算机,告诉它这是答案,不断做训练,达到75%的准确度,这是深度学习的方法。今天看来准确度不高,但当时是突破性的进展,证明图像识别是有用的。
这跟前面的过程有什么区别?
第一,需要更多的数据,第二,需要更大的计算力。
最大的好处把人解放了,最开始我们把知识交给机器失败了,到第三个阶段,我们放弃了人的经验,把数据交给机器,这就是今天跟原来的一个巨大区别。
这个区别很意义在哪儿呢?
比如做医疗系统,既需要工程师写代码,也需要工程师对医疗知识足够精通,这个很困难。写代码并不一定能传达知识理解,
今天这样一个时代到来之后,以深度学习为核心
,工程师们并不需要对专业知识理解了,可能只需要商务人员对这个事情有理解,然后把数据给工程师让他建模型。这个变化使得我们重新面对问题,组建公司的时候,可以分而治之,不需要找有行业经验的工程师。
机器最终的目标是什么?最后是创造生命,给机器一个目标,在地球表面活下去。这种情况,可以重演一次进化史。现在第三个阶段已经达到了,而且用的非常充分,只要原始数据非常规范,数据可解这是人工智能的阶段。2000 年到 2020 年,也许 20 年之后会走到第四个阶段。
这个话题很有意思,是通用型还是功能型的人工智能?
在人工智能有两大流派,我们到底做通用智能还是功能智能?
通用智能能处理所有的问题,可以跟你对话,可以做图象处理,同时可以语音识别等。专用的人工智能,就是解决一个特定的问题,比如能够语音识别,这是一个专业的问题,图像识别是另个专业的问题。
阿尔法狗就是功能型的人工智能,只能下围棋。
我个人判断,这个事情没有行业的定论。从我们的需求到我们的能力,现在我们只会做功能型的人工智能,通用的人工智能没有标性,还没有能力去做到。