如何区分人工智能、机器学习和深度学习？

硅谷密探 · 公众号 · 科技媒体 · 2017-03-17 11:58

正文

本文内容来自于硅谷投资人Lake Dai，LDV Partners合伙人。严肃编辑整理。

人工智能(Artificial Intelligence)是一个最广泛的概念，人工智能的目的就是让计算机这台机器能够象人一样思考，而机器学习(Machine Learning)是人工智能的分支，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，使之不断改善自身的性能。

深度学习(Deep Learning)是一种机器学习的方法，它试图使用包含复杂结构或由多重非线性变换构成的多个处理层（神经网络）对数据进行高层抽象的算法。

神经网络是一组大致模仿人类大脑构造设计的算法，用于识别模式。神经网络通过机器感知系统解释传感器数据，能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式，因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

在深度学习网络中，每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加，节点所能识别的特征也就越来越复杂，因为每一层会整合并重组前一层的特征。

（http://fortune.com/ai-artificial-intelligence-deep-machine-learning/）

上图显示了一个神经网络用于判定一个图片是不是一条狗的过程，输入是图片，通过深层神经网络对狗的低层特征进行抽象，最后输出是图片是狗的概率。

深度学习的过程同样是分为训练和推理（既“评估”）两个过程，通过训练过程来获得数据模型，然后用于评估新的数据。

数据模型分为两种，一种是所谓判别模型(Discriminative Model)，也就是说模型可以直接用来判别事物的。这里所说的判别事物，最典型的就是做分类。既然直接可以用来分类，也就是说我们可以在已知属性的条件下，对该记录进行判断。所以，判别模型是对条件概率进行的建模，也就是p(Y|X)。这里X就是属性集合，实际上就是一个向量；而Y则可能是一个值（此时对应分类问题），可能是一个向量（此时对应序列标注问题）。判别模型常用于处理分类问题（比如鉴定垃圾邮件）、图像识别等等。

再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说，已知了这个模型，我们就可以产生该模型描述的数据。而数据由两部分组成，也就是(X,Y)，前者是特征，后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据，也就是要对p(X,Y)进行建模，所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的，但是可以用来解决这些问题，也可以用于生成式问题，比如聊天机器人、比如AI谱曲等问题。

而机器学习可以分成下面几种类别：

监督学习从给定的训练数据集中学习出一个函数，当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出，也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。
无监督学习与监督学习相比，训练集没有人为标注的结果。常见的无监督学习算法有聚类。
半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。
增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响，学习对象根据观察到的周围环境的反馈来做出判断。