近年来,深度学习促进了计算机视觉领域的巨大进步,神经网络不断地推动着视觉识别技术的前沿。虽然许多这些技术,例如对象、地标、logo、文本识别等,是通过 Cloud Vision API 提供给互联网连接的设备,但我们相信,智能手机等移动设备日益强大的计算能力可以令这些技术交付到用户手中,不需互联网连接,随时随地可用。但是,手机上以及嵌入式应用程序的视觉识别有许多挑战,模型必须要能够在资源有限的环境中快速、高效地运行,必须要充分利用有限的计算力、功率和空间。
今天,我们很高兴地宣布开源 MobileNets,这是 TensorFlow上的“移动为先”(mobile-first)计算机视觉模型家族的一员,它能利用移动设备应用程序或嵌入式应用程序的有限资源,最大限度地提高准确性。MobileNets是小型、低延迟、低功耗的模型,参数化以满足各种用例的资源限制。它可以被构建用于分类、检测、嵌入和分割,功能类似其他流行的大规模模型(例如Inception)。
示例用例包括物体检测、细粒度分类、属性提取和地理定位。
此版本包含使用TF-Slim的TensorFlow中的MobileNets的模型定义,以及用于各种规模的手机项目的16个预训练ImageNet分类检查点。这些模型可以使用TensorFlow Mobile在移动设备上高效运行。
选择正确的MobileNet模型,以适应你的延迟时间和规模预算。内存和磁盘上网络的大小与参数数量成正比。网络的延迟时间和功率使用量与成绩累加运算(MAC)的数值相当。Top-1和Top-5的准确度是在ILSVRC数据集上测得。
我们很高兴与开源社区共享MobileNets,开源获取地址:https://github.com/tensorflow/models/blob/master/slim/nets/mobilenet_v1.md
在TensorFlow-Slim Image Classification Library可以获取开始使用信息,了解如何在设备上运行模型,请访问TensorFlowMobile:https://www.tensorflow.org/mobile
新智元专访论文作者:
AI新星 | 谷歌朱梦龙:从COCO物体检测冠军到MobileNet
更多细节,请阅读论文《谷歌MobileNet: 移动和嵌入式设备视觉应用模型,效果超越众主流模型》. (新智元介绍)
致谢:
主要贡献者: Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam
特别感谢: Benoit Jacob, Skirmantas Kligys, George Papandreou, Liang-Chieh Chen, Derek Chow, Sergio Guadarrama, Jonathan Huang, Andre Hentz, Pete Warden