专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  【[160星]Project ... ·  昨天  
量子位  ·  热搜第一!DeepSeek百万年薪招AI人才 ... ·  昨天  
爱可可-爱生活  ·  【Let's Build a Simple ... ·  昨天  
宝玉xp  ·  //@爱水de鱼儿:好答案来自于好问题 ... ·  2 天前  
新智元  ·  o3-mini物理推理粉碎DeepSeek ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

【前沿】R-FCN每秒30帧实时检测3000类物体,马里兰大学Larry Davis组最新目标检测工作

机器学习研究会  · 公众号  · AI  · 2017-12-11 23:31

正文

【导读】 美国马里兰大学、复旦大学和Gobasco人工智能实验室联合提出 R-FCN-3000实时3000类目标检测框架 ,对R-FCN框架中的物体检测和分类进行解耦。本文对R-FCN体系结构进行修改,其中位置敏感滤波器在不同的目标类之间共享来进行定位。对于细粒度的分类,这些位置敏感的滤波器是不需要的。因此,R-FCN-3000学习到了通用的物体性,也达到了更快的速度。R-FCN-3000在ImageNet检测数据集上获得34.9%的mAP,在每秒处理30帧图像的同时,可以以18%的优势超过YOLO-9000。作者相信,未来R-FCN-3000可以适用于更为广阔的目标检测场景(如十万类目标检测),并可以更好的整合目标类别先验。代码将会公开。


▌作者




  • Bharat Singh 马里兰大学计算机系博士生,主要研究方向为目标及动作识别

    http://www.cs.umd.edu/~bharat/


  • Hengduo Li 复旦大学在读本科生

    https://www.linkedin.com/in/hengduo-li-50588032/


  • Abhishek Sharma 印度德里农业供应链科技初创公司Gobasco联合创始人

    https://www.linkedin.com/in/abhishek-sharma-a1204921/


  • Larry S. Davis 马里兰大学教授

    http://www.umiacs.umd.edu/~lsd/


论文:R-FCN-3000 at 30fps: Decoupling Detection and Classification



摘要




我们提出了 R-FCN-3000 ,一个大规模的实时目标检测器,其中的目标检测和分类是解耦的。为了获得 RoI 的检测分数,我们将物体性分数( objectnessscore )乘以细粒度的类别分数。我们的方法是对 R-FCN 体系结构进行修改,其中位置敏感滤波器在不同的目标类之间共享来进行定位。对于细粒度的分类,这些位置敏感的滤波器是不需要的。 R-FCN-3000 ImageNet 检测数据集上获得 34.9 %的 mAP ,在每秒处理 30 帧图像的同时,超过 YOLO-9000 18 %。我们还表明, R-FCN-3000 学习的物体性可以被推广到新的类中,并且性能随着训练目标类的数量增加而增加。这个结论证明了我们可以学习通用目标检测器。本文将随后提供代码。


详细内容




随着深度 CNNs 的出现,目标检测在基准数据集上的性能取得了重大飞跃。这归功于 CNN 结构的强大的学习能力。在过去的五年中, PASCAL COCO mAP 得分分别从 33 %提高到 88 %和从 37 %提高到 73 %(在重叠率 50 %的评价标准上)。虽然在有数十个类别的基准数据库上有了很大的改进,但是对于需要实时检测数千个类别的现实生活中的目标检测进展甚微。最近的一些努力已经构建了了大规模的检测系统,但是以牺牲准确度为代价。

这篇文章提出了一个新颖的解决方案,能够在比







请到「今天看啥」查看全文