专栏名称: 小白学视觉
本公众号主要介绍机器视觉基础知识和新闻,以及在学习机器视觉时遇到的各种纠结和坑的心路历程。
目录
相关文章推荐
内蒙古自治区高级人民法院  ·  内蒙古高院公开遴选10人,2月21日起报名 ·  9 小时前  
内蒙古市场监管  ·  内蒙古地理标志保护工作取得突破性进展 ·  昨天  
内蒙古市场监管  ·  内蒙古地理标志保护工作取得突破性进展 ·  昨天  
内蒙古市场监管  ·  内蒙古地理标志保护工作取得实破性进展 ·  昨天  
内蒙古市场监管  ·  内蒙古地理标志保护工作取得实破性进展 ·  昨天  
内蒙古政府办公厅  ·  2024年内蒙古累计兑付惠企直达资金13.7亿元! ·  昨天  
内蒙古自治区文化和旅游厅  ·  过大年 闹元宵 | ... ·  昨天  
内蒙古自治区文化和旅游厅  ·  过大年 闹元宵 | ... ·  昨天  
51好读  ›  专栏  ›  小白学视觉

深度学习目标检测10年,即将引爆!

小白学视觉  · 公众号  ·  · 2024-07-26 10:17

正文

目标检测作为计算机视觉核心任务之一,在深度学习技术的高速发展下,近十年一直是重点研究方向, 相关论文数量逐年增长! 从R-CNN、YOLO,到SSD、RetinaNet,和引入Transformer的DETR,学界和业界创新不断, 关键技术也日新月异, 轻量化、端到端、3D目标检测,以及小目标、跨模态检测,甚至开放世界检测,重大突破即将到来!

为了帮助大家掌握 目标检测技术路线 ,研梦非凡于 7月30日(周二) ,邀请了 发表过 CVPR论文、 资深算法工程师Frank导师, 为大家独家详解 《深度学习目标检测十年速览》(AI前沿直播课NO.57), 目标检测的发展脉络,到单双阶段 算法, 重点讲解 YOLOv8、Faster R-CNN,并介绍Transformer目标检测(VIT、DETR)、目标检测与图像分割(Unet、Mask R-CNN),以及 损失函数, 1节课带大家速通主流方法,get论文或项目创新点,以及求职必问知识点!

👇🏻 扫描二维码找助教 0元 直播课!

凡预约即可免费领取 10 0 篇目标检测论文 直播课精选+顶会收录+综述+小目标检测方向等 )+文末还有算力等科研福利!



unset unset 直播课内容概览 unset unset

01 近十年目标检测发展脉络

  1. 目标检测发展概览

  2. 两阶段目标检测算法

  • R-CNN (2014):提出了使用选择性搜索生成候选区域,再用CNN分类的框架。精度高;但速度慢,计算开销大
  • Fast R-CNN (2015) :通过共享卷积特征提取来加速计算。速度较R-CNN提升显著;但仍需外部的候选区域生成方法
  • Faster R-CNN (2015) :引入区域提议网络(RPN),实现了候选区域生成和目标检测的端到端训练。速度和精度的平衡;但计算资源需求仍然较高
  • Mask R-C NN (2017) 在Faster R-CNN的基础上增加了分割任务,能够同时进行目标检测和实例分割。提供了更丰富的检测信息;但复杂度和计算需求更高
  1. 单阶段目标检测算法
  • YOLO (2015) 通过将图像分成网格并直接回归边界框和类别,首次提出单阶段检测器的概念。

  • YOLOv4 (2020) 综合了多种优化技术,如CSPDarknet53、PANet、SAM等。

  • YOLOv10 (2024) 通过双通道head设计和一对多标签分配策略,去除了NMS后处理。更容易部署和使用。

  • SSD (Single Shot MultiBox Detector, 2016) 使用多尺度特征图进行预测,可以同时检测不同大小的目标 速度快,精度较YOLO有所提升;但对小目标的检测仍有不足

  • RetinaNet (2017) 引入了Focal Loss,解决了类别不平衡问题,大大提升了单阶段检测器的精度。在精度上接近两阶段检测器,同时保持较快速度;但计算量较大,训练难度增加

  • EfficientDet (2020) 结合EfficientNet和BiFPN,实现了高效的目标检测。在速度和精度上均有显著提升;但复杂度高,需要较多调整

  • DETR (Detection Transformer, 2020) 基于Transformer架构,使用Attention机制进行目标检测。模型设计新颖,提供了一种全新的目标检测思路;但训练时间长,对计算资源要求高

  1. Anchor Free目标检测算法
  • CenterNet: 一种基于关键点的目标检测方法,通过预测物体中心点来进行检测。

  • CornerNet: 一种基于角点的目标检测方法,通过检测目标的左上角和右下角来确定边界框。

02 单阶段与双阶段目标检测

  1. 介绍单阶段目标检测
  • 以YOLOv8为例
  1. 介绍双阶段目标检测
  • 以Faster R-CNN为例

03 Transformer目标检测

  1. VIT
  • 一种基于Transformer架构的模型,用于处理图像数据,在多个视觉任务上展现出了优异的性能
  • 架构分析
  1. DETR
  • 无需预定义的先验Anchor、NMS的后处理策略,即可实现端到端目标检测
  • 架构分析

04 目标检测与图像分割

  1. Unet
  • 一种CNN架构,适合处理需要精确定位的图像分割任务
  • 架构分析
  1. MaskRcnn
  • 引入了Mask分支,以实现对目标实例的像素级分割
  • 架构分析

05 损失函数详解

  1. 分类损失
  • 用于训练模型以正确识别图像中的目标类别
  • 公式讲解
  1. 定位损失
  • 用于衡量模型预测的边界框与真实边界框之间差异的损失函数
  • 公式讲解

导师介绍

Frank导师

【个人背景】 国内一线车企研究院资深算法工程师,擅长感知算法方向,在语义分割、车道线检测、2D和3D目标检测、BEV目标检测等领域,具有丰富的项目创新和落地经验。

【研究成果】 曾主导多个重大项目,精通算法研究和部署端优化,以主要研究者身份,发表过CVPR多模态方向论文,在CV领域积累了多篇授权和落地专利。

直播福利

参加本次直播的同学都将获得 1小时导师meeting的福利(助教+导师)! 原价2999, 限时福利价 9.9元 活动时间为 7月30日到8月31日。

ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松完成论文报告。

👇🏻 扫描二维码找助教 0元 直播课!

凡预约即可免费领取 10 0 篇目标检测论文 直播课精选+顶会收录+综述+小目标检测方向等 )+文末还有算力等科研福利!


unset unset 研梦非凡科研论文指导 unset unset

如果你的研究方向/方法/idea是属于 CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向, 如果你需要发 CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等, 都可以来研梦非凡,匹配合适的科研指导。

研梦非凡可指导的研究方向

主流方向科研论文常用方法

研梦非凡现有idea

👇🏻 扫码找助教了解更多/验证自己的idea是否可行



unset unset 研梦非凡科研论文指导方案 unset unset

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。 研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。 授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!






请到「今天看啥」查看全文