专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
深圳发布  ·  本轮降温过后,会出现回南天吗? ·  2 天前  
51好读  ›  专栏  ›  我爱计算机视觉

COCO mAP 53.3!骨干网合成算法CBNet带来目标检测精度新突破

我爱计算机视觉  · 公众号  ·  · 2019-09-13 23:59

正文

点击 我爱计算机视觉 标星,更快获取CVML新技术



分享一篇前几天新出的论文CBNet: A Novel Composite Backbone Network Architecture for Object Detection,文中提出一种新型特征融合算法,有效提升了目标检测和实例分割精度,CBNet配以Cascade RCNN取得了COCO 数据集 mAP 53.3 的新高度!


以下是作者信息:



作者来自北京大学和Stony Brook University。


一个好的骨干网可有效提升目标检测精度。


但设计一个好的骨干网却并非易事,那能不能对现有骨干网进行更好的特征融合呢?


CBNet的核心就是使用现有骨干网合成新的骨干网,合成的方法很简单,就是对于相同类型的多个骨干网,进行信息的跨层或同层传播。


下图即为CBNet算法图例:



前一个骨干网的结果回传到下一个骨干网相同层之前,使用最后一个Lead Backbone进行检测或分割。K 代表组合骨干网的个数。


下图为作者在COCO test-dev数据集上的实验,Single代表单模型,DB为对两个骨干网进行合成,TB为三个。



可见,CBNet有效改进了目标检测和实例分割的精度。


下图为与其他state-of-the-art算法相比较,CBNet 加持下的Cascade Mask R-CNN取得了COCO数据集上的精度新高,而且是每个评价指标下都是最好的。



作者指出,根据不同特征传播的方式,还有其他可能的骨干网合成方法,如下图:



并对不同的合成方法进行了实验:



发现合成方法(a)即AHLC是较好的方法。


合成骨干网数量是不是越多越好呢?如下图,作者研究发现,数量超过3个后,精度改进就不再明显了。


很显然这种方法会使得速度变慢,作者实验中,FPN+ResNeXt为 8 fps,两个backbones 合成后为5.5FPS。可能对于打比赛,这个方法更有意义。


论文地址:

https://arxiv.org/abs/1909.03625

代码地址:

https://github.com/PKUbahuangliuhe/CBNet


更多阅读:

继往开来!目标检测二十年技术综述

目标检测中的不平衡问题综述




目标检测交流群


关注最新最前沿的目标检测技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

请务必注明:目标检测







请到「今天看啥」查看全文