目标检测作为最热门的研究课题之一,一直是工业界重点研究的对象。这几年,这领域出现了不少检测框架,其中最火爆的当属YOLO系列,它也是我们搞创新的头号选择。
不过目前的YOLO已经相当成熟,如果只是单纯改进,涨点讲故事就有点难,不妨多考虑别的方向。比如
通用目标检测多场景应用、遥感目标检测识别、二维图像领域目标检测、三维点云领域目标检测
等等。
再讲细一点,拿二维图像领域这个来说,我们可以改进transformer用于目标检测(如针对损失函数进行改进、设计新的目标函数...)、做轻量级目标检测网络(针对网络结构复杂设计轻量化模型)等,这些idea发个1-3区基本不成问题。
为方便大家理解,我根据以上方向整理了
30篇
目标检测最新论文
供大家参考,有代码可复现,需要的同学自取。
扫码添加小享,
回复“
目标创新点
”
免费获取
全部论文+开源代码
通用目标检测多场景应用
结合大模型
Few-Shot Object Detection with Foundation Models
方法:
本文通过利用大型预训练视觉/语言基础模型简化少样本目标检测(FSOD)任务中的人工设计,提出了一种结合LLM的上下文学习能力的新方法,并在多个基准测试中验证了其有效性,显著提高了FSOD性能,特别是在有较多样本的情况下。
创新点:
-
利用预训练视觉基础模型(如DINOv2)的强大视觉特征提取能力和自监督学习目标,结合变形DETR的检测框架,显著提升了少样本目标检测(FSOD)的性能。
-
通过在固定顺序中提示大语言模型对每个提案进行分类,减少了生成无序边界框的复杂度,简化了LLM的学习过程。
二维图像领域目标检测多场景应用
改进transformer用于目标检测
GM-DETR:Generalized Muiltispectral DEtection TRansformer with Efficient Fusion Encoder for Visible-Infrared Detection
方法:
论文提出了一种新的多光谱目标检测方法,针对多光谱数据中的目标检测问题。作者引入了两阶段训练策略和GM-DETR模型,结合了具有高效融合能力的编码器,包括MSFI和CMSF模块。通过在FLIR和LLVIP数据集上的实验验证了其优于现有方法的性能,显著改善了检测精度。
创新点:
-
引入了一种两阶段的训练策略,用于多光谱目标检测。这种策略包括“Isolation阶段”和“Fusion阶段”,在前者中分别训练红外(IR)和RGB数据,然后在后者中进行融合训练。
-
提出了GM-DETR模型,集成了一个高效的融合编码器。该编码器包括两个模块:模式特定特征交互(MSFI)模块和跨模式尺度特征融合(CMSF)模块。
扫码添加小享,
回复“
目标创新点
”
免费获取
全部论文+开源代码
遥感目标检测识别+多场景应用
设计高精准,低复杂度的旋转框遥感检测器
Few-Shot Object Detection in Remote Sensing:Lifting the Curse of Incompletely Annotated Novel Objects
方法:
作者解决了遥感图像中少样本目标检测(FSOD)中的不完全注释新颖对象(IANOs)问题,通过引入自训练机制到经典的两阶段微调FSOD流程中,提出了ST-RPN和ST-BBH模块,以识别和利用伪标签来提升新颖对象的检测性能,显著超越了现有方法。
创新点:
-
提出将自训练机制应用于区域提议网络(RPN)和RoI层的边界框头(BBH),提出了自训练RPN(ST-RPN)和自训练BBH(ST-BBH)模块。
-
首次在遥感图像的少样本目标检测(FSOD)中探讨并解决了IANO问题。
-
三维点云领域目标检测多场景应用