专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
黄建同学  ·  收藏了,通过languine可以基于AI ... ·  昨天  
爱可可-爱生活  ·  今日推介(第1630期):递归训练中的模型坍 ... ·  2 天前  
爱可可-爱生活  ·  【深度思考第二十五篇:AI时代的教育创新不是 ... ·  4 天前  
黄建同学  ·  Jupyter Agent,这个厉害了! ... ·  5 天前  
51好读  ›  专栏  ›  机器学习研究会

从R-CNN到Mask R-CNN

机器学习研究会  · 公众号  · AI  · 2017-11-13 23:16

正文



点击上方“机器学习研究会”可以订阅
摘要
 

转自:taigw

自从2012年的ILSVRC竞赛中基于CNN的方法一鸣惊人之后,CNN已成为图像分类、检测和分割的神器。其中在图像检测的任务中,R-CNN系列是一套经典的方法,从最初的R-CNN到后来的Fast R-CNN, Faster R-CNN 和今年的Mask R-CNN, 我们可以看到CNN在图像检测中是如何一点一点提高的。和本文来一道回顾R-CNN家族的发展史,了解这些方法的演变和这个演变过程中的那些富有创意的想法。


R-CNN 系列的四篇文章如下:

  1. R-CNN: arxiv.org/abs/1311.2524

  2. Fast R-CNN: arxiv.org/abs/1504.0808

  3. Faster R-CNN: arxiv.org/abs/1506.0149

  4. Mask R-CNN: arxiv.org/abs/1703.0687

图像的检测任务是从一个复杂场景的图像中找到不同的物体,并且给出各个物体的边界框。图像检测的三个著名的数据集是PASCAL VOC,ImageNet和微软COCO. PASCAL VOC包含20个物体的类别,而ImageNet包含一千多种物体类别,COCO有80中物体类别和150万个物体实例。

PASCAL VOC目标检测


COCO目标检测和实例分割


1, R-CNN

R-CNN的思路是很直观的三步曲:1,得到若干候选区域;2, 对每个候选区域分别用CNN分类;3,对每个候选区域分别进行边框预测。

在R-CNN出现之前,目标检测的流行思路是先从图像中得到一些候选区域,再从候选区域中提取一些特征,然后利用一个分类器对这些特征进行分类。分类的结果和候选区域的边界框就可以作为目标检测的输出。一种得到候选区域的方法是Selective Search, 该方法可以得到不同尺度的候选区域,每个候选区域是一个联通的区域。如下图中,左边得到的是较小的候选区域,右边是较大的候选区域,在该尺度下包含了整个人的区域。


原文链接:

https://zhuanlan.zhihu.com/p/30967656?group_id=913258673741639680

“完整内容”请点击【阅读原文】
↓↓↓