专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

深度学习平台技术演进

机器学习研究会 · 公众号 · AI · 2017-12-30 23:17

正文

2017年12月22日，袁进辉（老师木）代表OneFlow团队在全球互联网架构大会上海站做了《深度学习平台技术演进》的报告，小编对报告内容作简要梳理注解，以飨读者。

此次报告的主要观点为：（1）计算力是神经网络/深度学习复兴的最大推动力之一；（2）面对深度学习的计算力挑战，软件至少和硬件一样地关键，单靠硬件无法提供易用性和扩展性；（3）鉴于深度学习上层业务和底层硬件的独特性，传统大数据平台里的某些技术未必再对深度学习平台适用；（4）深度学习软件平台技术在快速演进中，一部分早期被采用的技术正在被新方法替代；（5）仍有很多重要问题未被现有开源深度学习平台解决；（6）深度学习软件尚处在发展早期，百花齐放，百家争鸣，但必将收敛到一种业界公认的最佳实践（best practice）。

注：深度学习在近些年带来的突破无须赘言，从图像 (ImageNet) ，语音，围棋人机大战等方面的突破都源于深度学习技术。

注：机器学习可以视为一种从训练数据中自动推导出程序的方法。以最常见的有监督学习（supervised learning）为例，可简单理解为，通过优化方法自动在高维空间找到分类超平面。

注：现实中遇到的绝大部分机器学习问题，基于原始特征（Input Space）无法找到分类超平面把训练数据里的正例和负例恰好分开。在机器学习领域，有一些通用的手段来处理线性不可分的问题，譬如可以在Input Space 寻求非线性分界面，而不再寻求线性分界面；也可以通过对特征做预处理，通过非线性映射的手段把训练数据从Input Space 映射到一个所谓的Feature Space，在原始Input Space无法线性可分的样例在Feature Space有可能线性可分。深度学习就是这种思想的一个典型应用。

注：深度学习从计算上体现为一连串的变换（transformation），常见的变换都可以表示成矩阵计算。以上图为例，输入层有6个神经元，输出层共有4个神经元，每个输出神经元都和输入层的每个神经元有一条边相连，每条边有一个对应的权重（红色神经元的输入边权重都用红色表示）。输入数据是4个样例，每个样例是一个6维的列向量，列向量的每一维对应输入层的一个神经元。输入数据经过这层神经元的作用，仍是4个样例，每个样例变成了4维的列向量。这样一层神经网络可以用右图的矩阵乘法来表示。像这种稠密矩阵运算意味着并行计算的潜力。

深度学习平台技术演进

正文

请到「今天看啥」查看全文