开放词汇目标检测,正在超越Faster R-CNN、DETR、YOLOs等传统方法,成为CV领域极具潜力的研究方向,近两年顶会创新也层出不穷,
腾讯重磅发布不久的YOLO-World,便是一种先进的开放词汇检测器,
基于简洁高效的
YOLOv8架构,通过视觉语言建模,以及大规模数据集的预训练,
能够识别并定位训练集中未出现的新类别物体,
具备超强的零样本及泛化性能,部署轻便!
为了帮助大家掌握YOLO-World,研梦非凡于
9月10日晚(周二),
邀请了CV领域资深算法工程师Frank导师,独家详解
CVPR'24收录工作
《YOLO-World:实时开放词汇目标检测》
(
AI前沿直播课NO.66),
从传统目标检测回顾,到开放词汇/开集目标检测介绍,
重点讲解YOLO-World主要贡献、网络结构及算法原理,并代码演示如何使用YOLO-World,
1节课速通开放词汇目标检测,get论文改进和求职面试知识点!
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约即可免费领取
170篇
目标检测精选论文(开放词汇/YOLO系列/顶会收录等)+
文末还有算力等科研福利!
unset
unset
本节直播课内容概览
unset
unset
01 开放词汇目标检测和开集目标检测
-
-
-
-
-
区别:与OVOD不同,识别出未知类别后,不再继续判断
02 YOLO-World简介
-
-
-
-
-
强大的零样本性能,在LVIS上达到35.4 AP和52.0 FPS
-
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约即可免费领取
160篇
目标检测精选论文(开放词汇/YOLO系列/顶会收录等)+
文末还有算力等科研福利!
03 YOLO-World算法原理
-
-
-
主要包括Darknet骨干、路径聚合网络(PAN)、Head结构
-
-
采用CLIP预训练的Transformer文本编码器
-
-
Re-parameterizable Vision-Language PAN(RepVL-PAN)
-
-
通过文本引导CSPLayer和图像池注意,进一步增强图像特征和文本特征之间的交互
-
-
04 YOLO-World代码讲解
unset
unset
导师介绍
unset
unset
【个人背景】
国内一线车企研究院资深算法工程师,
擅长感知算法方向,在语义分割、车道线检测、2D和3D目标检测、BEV目标检测等领域,具有丰富的项目创新和落地经验。
【研究经历】
曾主导多个重大项目,精通算法研究和部署端优化,以主要研究者身份,
发表过CVPR多模态方向论文,在CV领域积累了多篇授权和落地专利。
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约即可免费领取
160篇
目标检测精选论文(开放词汇/YOLO系列/顶会收录等)+
文末还有算力等科研福利!
unset
unset
YOLO系列课程开学季活动
unset
unset
独家课程一《YOLOv8-10速成课程》
-
主要内容:精讲YOLOv8-10论文和代码,以及具体任务的轻量化部署
-
-
-
-
开课福利:免费领取YOLOV1-10全部论文&代码&数据集+YOLO近年改进论文等资料
-
独家课程二《YOLO全家桶训练营》
-
主要内容:重点讲解YOLOv1-10的算法原理、代码实现、项目实战等
-
-
-
课程形式:直播课,每周1节,目前已开课,本周预计上线第6节,下单后畅享往期回放
-
开课福利:
若完成课程打卡,送
价值2000元
的研梦年卡会员;
免费领取YOLOV1-10全部论文&代码&数据集+YOLO近年改进论文等资料
-
👇🏻
扫码加助教咨询/开课立享
开学
福利价!
unset
unset
研梦非凡科研论文指导方案
unset
unset
idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。
研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。
授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!