专栏名称: 学姐带你玩AI
这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI!
目录
相关文章推荐
张丽俊  ·  精进日志723 | 2.21 ·  2 天前  
51好读  ›  专栏  ›  学姐带你玩AI

目标检测除了改YOLO没得做了?来看看这些一投一个准的高区idea!

学姐带你玩AI  · 公众号  ·  · 2025-02-02 18:10

正文

目标检测作为最热门的研究课题之一,一直是工业界重点研究的对象。这几年,这领域出现了不少检测框架,其中最火爆的当属YOLO系列,它也是我们搞创新的头号选择。

不过目前的YOLO已经相当成熟,如果只是单纯改进,涨点讲故事就有点难,不妨多考虑别的方向。比如 通用目标检测多场景应用、遥感目标检测识别、二维图像领域目标检测、三维点云领域目标检测 等等。

再讲细一点,拿二维图像领域这个来说,我们可以改进transformer用于目标检测(如针对损失函数进行改进、设计新的目标函数...)、做轻量级目标检测网络(针对网络结构复杂设计轻量化模型)等,这些idea发个1-3区基本不成问题。

为方便大家理解,我根据以上方向整理了 30篇 目标检测最新论文 供大家参考,有代码可复现,需要的同学自取。

扫码添加小享, 回复“ 目标创新点

免费获取 全部论文+开源代码

通用目标检测多场景应用

结合大模型

Few-Shot Object Detection with Foundation Models

方法: 本文通过利用大型预训练视觉/语言基础模型简化少样本目标检测(FSOD)任务中的人工设计,提出了一种结合LLM的上下文学习能力的新方法,并在多个基准测试中验证了其有效性,显著提高了FSOD性能,特别是在有较多样本的情况下。

创新点:

  • 利用预训练视觉基础模型(如DINOv2)的强大视觉特征提取能力和自监督学习目标,结合变形DETR的检测框架,显著提升了少样本目标检测(FSOD)的性能。
  • 通过在固定顺序中提示大语言模型对每个提案进行分类,减少了生成无序边界框的复杂度,简化了LLM的学习过程。

二维图像领域目标检测多场景应用

改进transformer用于目标检测

GM-DETR:Generalized Muiltispectral DEtection TRansformer with Efficient Fusion Encoder for Visible-Infrared Detection

方法: 论文提出了一种新的多光谱目标检测方法,针对多光谱数据中的目标检测问题。作者引入了两阶段训练策略和GM-DETR模型,结合了具有高效融合能力的编码器,包括MSFI和CMSF模块。通过在FLIR和LLVIP数据集上的实验验证了其优于现有方法的性能,显著改善了检测精度。

创新点:

  • 引入了一种两阶段的训练策略,用于多光谱目标检测。这种策略包括“Isolation阶段”和“Fusion阶段”,在前者中分别训练红外(IR)和RGB数据,然后在后者中进行融合训练。
  • 提出了GM-DETR模型,集成了一个高效的融合编码器。该编码器包括两个模块:模式特定特征交互(MSFI)模块和跨模式尺度特征融合(CMSF)模块。

扫码添加小享, 回复“ 目标创新点

免费获取 全部论文+开源代码

遥感目标检测识别+多场景应用

设计高精准,低复杂度的旋转框遥感检测器

Few-Shot Object Detection in Remote Sensing:Lifting the Curse of Incompletely Annotated Novel Objects

方法: 作者解决了遥感图像中少样本目标检测(FSOD)中的不完全注释新颖对象(IANOs)问题,通过引入自训练机制到经典的两阶段微调FSOD流程中,提出了ST-RPN和ST-BBH模块,以识别和利用伪标签来提升新颖对象的检测性能,显著超越了现有方法。

创新点:

  • 提出将自训练机制应用于区域提议网络(RPN)和RoI层的边界框头(BBH),提出了自训练RPN(ST-RPN)和自训练BBH(ST-BBH)模块。
  • 首次在遥感图像的少样本目标检测(FSOD)中探讨并解决了IANO问题。
  • 通过组合所有模块,实现了新类检测精度的显著提高。

三维点云领域目标检测多场景应用







请到「今天看啥」查看全文