专栏名称: 深度之眼
入行人工智能,学算法公式,写毕业论文,看经典书籍,刷全球公开课,就来深度之眼
目录
相关文章推荐
51好读  ›  专栏  ›  深度之眼

CVPR王炸组合:特征融合+目标检测!想发高分就看这篇

深度之眼  · 公众号  ·  · 2024-11-28 20:42

正文

最近发现 用特征融合做目标检测 有了不少新突破,比如CVPR上的红外和可见光图像融合方法MetaFusion,以及Neurips上节约了99%传输成本的新型合作检测框架FFNet。

这主要得益于,特征融合在目标检测中整合了不同层或尺度的特征信息(既包含低层的细节信息,也包含高层的语义信息),这样不仅可以 提高检测的准确性 ,增强模型对复杂场景和目标的鲁棒性,减少误检和漏检, 还可以 降低计算复杂度,加快检测速度,提升整个检测系统的性能。

因此这种技术在学术界与工业界其实都很受欢迎,可以说为目标检测的研究提供了新的思路。如果有同学想发表相关论文,可以直接看我整理好的 12篇 特征融合+目标检测最新论文 ,核心创新点都提炼好了,开源代码已附。

扫码添加小享, 回复“ 特征目标

免费获取 全部论文+开源代码

A Saliency Enhanced Feature Fusion Based Multiscale RGB-D Salient Object Detection Network

方法: 该论文提出了一种基于显著性增强特征融合模块(SEFF)的多尺度RGB-D显著目标检测网络,通过融合RGB和深度图像及不同尺度解码器的特征,显著提升了检测性能。

创新点:

  • SEFF模块通过利用邻近尺度的显著性图来增强所需的特征,能够生成更具代表性的融合特征。
  • 建立在SEFF模块基础上的SEFFsal是一个多尺度RGB-D显著性检测网络。该模型通过在不同尺度上处理图像,进一步提升了显著性检测的效果。
  • SEFFsal的设计考虑了模型的轻量化需求,通过有效的特征融合减少了模型的计算开销和尺寸。

Emiff: Enhanced multi-scale image feature fusion for vehicle-infrastructure cooperative 3d object detection

方法: 论文提出了一个名为EMIFF的新型框架,用于车辆基础设施协同3D目标检测任务。EMIFF框架通过设计多尺度交叉注意力和相机感知通道掩蔽模块来增强基础设施和车辆特征,并在尺度、空间和通道级别上进行特征增强,以校正由相机时间异步引起的位姿误差。

创新点:

  • 提出了一种新颖的中间融合框架EMIFF,用于车辆基础设施协作3D目标检测(VIC3D)任务。
  • 设计了MCA和CCM模块,以在尺度、空间和通道层面动态增强多视角特征,从而提升检测性能。
  • 引入了特征压缩模块,通过通道和空间压缩块降低传输成本,提高传输效率,同时保持高效的检测性能。

扫码添加小享, 回复“ 特征目标

免费获取 全部论文+开源代码

Bgf-yolo: Enhanced yolov8 with multiscale attentional feature fusion for brain tumor detection

方法: 本文提出了一种名为BGF-YOLO的新模型,通过引入双层路由注意力、广义特征金字塔网络和第四检测头,提高YOLOv8在脑肿瘤检测中的性能,采用多层特征融合与动态稀疏注意机制以减少特征冗余。

创新点:

  • 通过引入动态和稀疏注意机制,BGF-YOLO能够聚焦于更显著的特征,减少特征冗余,提高模型的检测性能。
  • 通过重构YOLOv8的颈部结构为基于GFPN的特征融合网络,BGF-YOLO能够在不同层次上实现更有效的特征融合,增强了特征表示能力。
  • 通过添加第四个检测头,BGF-YOLO能够丰富锚框的尺度,并优化回归损失,提高了模型的精度和鲁棒性。

Cross-modal Feature Fusion via Mutual Assistance: A Novel Network for Enhanced Object Detection

方法: 论文提出了一个名为MFFNet的新型跨模态目标检测框架,该框架结合了红外和可见光图像来提高检测的准确性。MFFNet采用了基于YOLOv5的双流骨干网络,独立提取两种模态的特征,并通过提出的互助融合块在网络的中间层进行特征融合,实现了两种模态之间的互补融合。







请到「今天看啥」查看全文