启明 编译整理
量子位 出品 | 公众号 QbitAI
计算机视觉领域的机器学习探索一直在前进,不过在单一图片中定位和识别多个对象的精确机器模型仍然是核心挑战之一。
去年10月,Google在这一方向取得新的突破,并将新技术应用到NestCam、图像搜索和街景地图等产品之中。今天,Google宣布将这一系统通过TensorFlow Object Detection API对外发布。
据介绍,这个代码库是一个建立在TensorFlow上的开源框架,可以用于构建、训练和部署对象检测模型。第一个版本包括以下内容:
一系列可训练的检测模型,包括:
SSD(Single Shot MultiBox Detector),MobileNet
SSD,Inception V2
基于区域的全卷积网络(R-FCN),Resnet 101
Faster RCNN,Resnet 101
Faster RCNN,Inception Resnet v2
使用MobileNet的SSD模型非常轻便,可以在移动设备上实时运行。
上述各种模型的冻结权重(基于COCO数据库训练)用于开箱即用的推理。同时还搭配一个Jupyter notebook。便捷的训练脚本和分布式训练,以及基于Google云的评价体系。
GitHub地址:
https://github.com/tensorflow/models/tree/master/object_detection
Google官方还发布了一个新API的使用教程。
这个教程基于Oxford-IIT宠物数据集,根据教程的指引,你可以训练出一个能准确定位识别猫狗的网络,并且能识别出具体的品种。
整个教程基于Ubuntu 16.04系统,完成的内容可以直接访问这个网址:
https://cloud.google.com/blog/big-data/2017/06/training-an-object-detector-using-cloud-machine-learning-engine
【完】
一则通知
量子位正在组建自动驾驶技术群,面向研究自动驾驶相关领域的在校学生或一线工程师。欢迎大家加量子位微信(qbitbot),备注“自动驾驶”申请加入哈~
招聘
量子位正在招募编辑记者、运营、产品等岗位,工作地点在北京中关村。相关细节,请在公众号对话界面,回复:“招聘”。
△ 扫码强行关注『量子位』
追踪人工智能领域最劲内容