前段时间北大号称终结YOLO的RT-DETR大家关注了没?还有它超越YOLOv10的进阶版RT-DETRv3...百度&北航&中科院也爆成果了,提出LW-DETR,性能优于YOLO系列...最近有关
DETR改进
的研究简直太热闹。
众所周知,
DETR是一种创新的目标检测框架,在学术研究和特定高精度需求的应用中一直表现出色。
一方面,DETR基于Transformer的架构,简化了传统OD方法中的复杂步骤,提高检测精度的同时也提升了模型的灵活性和泛化能力。
另一方面,DETR讲故事的能力更突出,对于论文er来说,目标检测领域如果想发三区及以上,还是选择改DETR更适合。比如百度就有一篇CVPR 2024,提出的KD-DETR mAP提升近一半,Neurips上我也发现不少...
本文挑选了
12篇
DETR最新改进成果
分享,全部都有代码,方便各位有论文需求的同学作参考,整理不易,点个赞支持一下~
扫码添加小享,
回复“
DETR改进
”
免费获取
全部论文+开源代码
DETRs Beat YOLOs on Real-time Object Detection
方法:
论文介绍了一种名为RT-DETR的新型实时目标检测器。这个模型是首个据作者所知的实时端到端(end-to-end)目标检测器,它在速度和准确性上都超越了现有的实时目标检测器,包括YOLO系列。
创新点:
-
RT-DETR 引入了高效的混合编码器,用于快速处理多尺度特征,从而显著提高推理速度。
-
RT-DETR 提出了不确定性最小查询选择方案,通过明确优化不确定性,为解码器提供高质量的初始查询,从而提高准确性。
LW-DETR: A Transformer Replacement to YOLO for Real-Time Detection
方法:
论文介绍了一种轻量级的检测Transformer,LW-DETR。通过多层特征聚合和高效的训练、推理技术,在COCO等基准数据集上实现了比现有实时检测器(如YOLO系列)更优的性能和更低的延迟。
创新点:
-
轻量级架构:结合ViT编码器和DETR解码器,简化实时检测模型。
-
特征聚合与注意力优化:聚合多级特征图,优化注意力机制,降低计算复杂度。
-
预训练和监督策略:大规模预训练和改进的监督策略提升性能和训练效率。
扫码添加小享,
回复“
DETR改进