专栏名称: AI前线

我们专注大数据和机器学习，关注前沿技术和业界实践。每天发布高质量文章，技术案例等原创干货源源不断。同时有四千人的社群微课堂，每周一次业界大牛技术分享，也希望你能从这里分享前沿技术，交流深度思考。

BMXNet：基于MXNet的二进制神经网络实现

AI前线 · 公众号 · 大数据 · 2017-10-26 18:01

正文

作者｜Haojin Yang 等

译者｜薛命灯

编辑｜Emily

近年来，深度学习在学术和行业领域取得突破性的进展，但深度学习需要耗费大量的计算和存储资源。与此同时，移动、可穿戴设备、自动机器人和物联网对深度学习的需求愈加旺盛，所以如何将深度学习模型应用在这些低配置的设备上成为了一个巨大的挑战。二进制神经网络（BNN）的出现解决了在低配置设备上应用深度学习模型的难题。

位于德国波茨坦的 Hasso Plattner Institute 近日开源了一个 BNN 库，叫作 BMXNet。它基于 Apache MXNet，使用 C 和 C++ 实现，支持将 BNN 层无缝地与其他标准库组件结合在一起，并支持 GPU 和 CPU 两种模式。

BMXNet 提供了激活层、卷积层和全连接层，并支持二进制的输入数据和权重。它们分别是 QActivation、QConvolution 和 QFullyConnected，分别与 MXNet 的三个层对应。它们提供了一个额外的参数 act_bit，用于控制位宽。

在传统的深度学习模型中，全连接和卷积层严重依赖矩阵的点积，导致出现大量的浮点数运算。而二进制权重和输入数据可以利用 CPU 的 xnor 和 popcount 指令，从而极大地提升矩阵乘法的性能。

在训练阶段，BMXNet 二进制化的层衔接 MXNet 内置的层，将权重和输入限制在 -1 和 +1 之间的离散值范围内。在计算出点积之后，将计算结果映射回 xnor 风格的点积值区间。

在使用 BMXNet 训练之后，权重以 32 位浮点变量的形式保存下来，使用 1 个 bit 位宽训练得到的网路也是如此。BMXNet 提供了 model_converter，用于读取训练过的二进制文件和打包 QConvolution 及 QFullyConnected 层的权重。经过转换之后，每个权重只占用一个 bit 的存储空间和内存。

以下是 BMXNet 在 MNIST（手写识别）和 CIFAR-10（图像分类）数据集上训练得出的一个实验结果。