(一)基础理论与方法
聚类和概率密度估计是模式识别的基本问题。近年来,相关研究主要集中于集成聚类、多视图聚类、子空间聚类等研究方向上。比如,中山大学提出了一种基于稀疏图和概率轨迹分析的集成聚类方法[1],通过随机游走概率轨迹相似性来获得聚类结果;中科院西安光机所提出了一种重赋权判别嵌入K-均值多视图聚类方法[2];西北工业大学构建了一个双边K均值快速协同聚类模型[3]。在子空间聚类方面,清华大学提出的贝叶斯非参数子空间聚类方法[4]、北京大学提出的基于张量低秩描述的子空间聚类方法[5]等均受到广泛关注。
特征提取与选择是高维模式分析的重要工具,是避免“维数灾”的重要方法。在特征提取方面,浙江大学提出了一种称为A-最优投影[6],为图像描述提供新视野和新方法; 同时,提出一种可微分散度判别准则,并将其应用于大规模局部特征维数缩减[7]。另外,中科院计算所的多视角判别分析方法[8]、西北工业大学的白化重构二维主成分分析[9]、广东工业大学的广义拉普拉斯低秩描述框架[10]等都是一些亮点工作。在特征选择方面, 中科院自动化所提出了一种可同时实现特征选择与子空间学习的多模态学习模型[11],并在跨模态检索中取得较好的应用效果。
在分类器构造方面,国内学者取得了一系列研究成果。清华大学提出了一个有关核贝叶斯推断的最优化方法,给出了核贝叶斯推断新见解[12]。南京大学提出建立了一种半监督支持向量机,并设计出相关学习方法来确保未标注数据能够提升分类器性能[13]。南京航空航天大学构建了一个在错误校正输出码框架下的可联合训练多个两类分类器的方法[14]。中科院自动化所提出了一个重定位最小二乘回归方法[15],采用类别标签竞争机制作来提升多类分类精度。针对支持向量机割平面算法,清华大学提出了一种高效的线搜索策略[16],降低了模型的计算复杂度。
在稀疏学习方面,浙江大学提出了一种基于随机合成优化的稀疏学习方法,并给出了相应的理论分析[17];中科院自动化所提出了一种基于半二次最小迭代的鲁棒稀疏表示方法[18]、一种鲁棒的低秩矩阵恢复方法[19]。字典学习与稀疏表示紧密相关,中科院自动化所提出了一种耦合字典学习方法[20],清华大学提出了一个可同时进行特征学习和字典学习的模型[21]。这些工作丰富了字典学习的方法体系。
在概率图模型与结构模式识别方面也呈现出一些亮点工作。特别是,清华大学提出了一种如何提升贝叶期隐变量学习模型多样性的方法[22],提出了一种基于并行分布式采样 的大规模隐狄利克莱分派模型学习方法[23],构建了判别相关主题模型和最大无限隐马尔可夫模型[24]。另外,电子科技大学提出采用马尔可夫网络来获取异质人脸图描述方法[25],中山大学提出了一种“与—或”图结构[26],并将其应用于形状检测。
深度学习无疑是模式识别和机器学习领域中的热点研究方向。国内在深度学习的应用方面取得了前所未有的新成果,并在自然图像目标检测与识别、图像分割、语音识别、生物特征识别等方向上尤为显著。在新型网络构建方面,比如,清华大学构建的条件生成矩匹配网络[27]和一种三元(生成器、判别器和分类器)生成式对抗网络[28]、中科院自动化所构建的不规则滤波深度卷积神经网络[29]、浙江大学的深度旋转等变网络[30]等均具有鲜明特点。另外,南京大学提出了深度森林模型[31],并将其命名为gcForest。在结构上,gcForest是一种多粒度级联森林;在学习方法上,该模型是一个决策树集成学习模型。该方法是“向着深度学习以外的方向进军”的标志性工作。
(二)应用研究
最近几年,随着人工智能技术的广泛应用以及相关概念的提出,模式分类与机器学习的应用研究也取得了十分丰富的成果,涉及人工智能的各个方向和各种类型的应用。特别地,在文字识别、语音识别、自然语言处理、生物认证、医学图像分析、遥感图像分析、多媒体分析、信息检索、社会感知数据智能处理、大数据分析等多个任务中取得了重要的研究成果。对上述各方面全面的总结已超出本报告的范围。这里仅列举部分应用研究成果。
在多媒体检索方面,浙江大学提出的密度敏感哈希方法[32],中科院自动化所的非对称哈希编码[33]、清华大学的非离散哈希学习方法[34]等丰富了哈希学习的方法体系。在跨模态检索方面,中科院自动化所提出了基于特征选择与子空间学习的跨模态检索[27]和端到端跨模态检索双向深度神经网络模型[35],可以实现以“句子”-“图像”的双向检索。
基于深度学习的视觉计算方法得到空前发展,视觉计算系统的精度和鲁棒性有了很大提高。特别地,公安部第三研究所过去几年连续在世界最具影响力的视觉目标识别竞赛ILSVRC中取得优异成绩。另外,中山大学在行人分割[36,37]、西北工业大学在视觉显著性目标检测[38]、中国人民大学在图像语义分割[39]等方面均取得了一定的进展。
在文字识别方面,中科院以及华中科技大学、华南理工大学、北京科技大学等相关课题组也取得重要研究进展。比如,中科学自动化所提出并完善了基于过切分框架的多上下文集成中文识别算法,并取得较好的实际应用效果[40];华南理工大学提出了一个端对端在线文本独立书写人识别框架[41];华中科技大学提出一种多尺度多水平场景文字深度表示学习方法[42],等等。这些工作有力地推进了我国文字识别研究与应用水平。
在生物特征识别方面,国内学者也取得了显著成果,部分研究水平达到国际前沿。比如,中科院自动化所提出了基于卷积神经网络的多视角步态识别方法[43]、一种基于归一化像素差异的快速精确无约束人脸识别方法[44]、一种基于层次视觉编码表示的虹膜图像识别方法[45]。中山大学提出了一种开放条件下行人再识别方法[46],并从机器学习的角度构建了可传递局部距离比较信息的学习模型。