清华大学、IDEA研究院联合提出的Grounding DINO,采用了目标检测器DINO的Transformer架构,并借鉴了多模态GLIP的预训练方法,深度融合语言和视觉信息后,
可根据文字描述检测任意目标,实现了开集检测性能的重大突破,不仅被ECCV'24成功收录,相关改进也层出不穷,甚至能结合扩散模型完成修图,
正在超越DETR、YOLOs等检测系列,成为视觉或多模态极具前景的研究方向!
为了帮助大家掌握热门的Grounding DINO,研梦非凡于
9月25日晚(周三)
,邀请了
CV资深算法工程师张导师
,独家讲解
ECCV'24创新工作
《Grounding DINO:最强开集目标检测器!》
(AI前沿直播课NO.70),
从开集与闭集目标检测的关系,到Grounding DINO的研究背景、主要贡献,
重点讲解模型结构、训练方法和实验,并详解代码和Demo演示,
1节课速通最先进的开集目标检测器,get论文改进和求职面试知识点!
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约可享
8节
《
2024目标检测前沿课程
》福利+
20
0
篇
目标检测精选论文&代码
(下拉查看活动+大纲)
unset
unset
9.25直播课内容概览
unset
unset
01 Grounding DINO基本信息
-
-
02 开集与闭集目标检测器的关系
-
-
开集目标检测器:可以检测指定的任意对象,在闭集检测器中引入语言特征
03 Grounding DINO的特点
-
以DINO为基础,基于Transformer的检测器
-
-
-
-
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约可享
8节
《
2024目标检测前沿课程
》福利+
20
0
篇
目标检测精选论文&代码
(下拉查看活动+大纲)
04 Grounding-DINO的总体结构(重点)
-
-
-
-
-
05 训练方法和实验
-
-
-
-
-
将Grounding DINO和Stable Diffusion应用于图像编辑
06 代码&Demo演示(重点)
直播课导师介绍
某上市公司
高级算法工程师,
在自动驾驶感知等视觉领域,拥有5年以上工作经验,
尤其是
目标检测、目标跟踪、图像分割,以及点云、多模态、模型轻量化和部署方向,一线项目经历丰富,具备高水平的
P
ython、P
ytorch等开发能力。
👇🏻
扫描二维码找助教
0元
预约
直播课!
凡预约可享
8节
《
2024目标检测前沿课程
》福利+
20
0
篇
目标检测精选论文&代码
(下拉查看活动+大纲)
2024目标检测前沿8节课
凡
预约
本节直播课,即可
福利价
获得Frank导师
《2024目标检测前沿8节课》!
2024全新录播课,
共8节
(包括以上9.25直播课),每节课时长1-2小时!
分为两大部分:4
节《2024目标检测前沿之
从闭集迈向开集
》
+4节《2024目标检测前沿之
YOLOv8-10
》,具体下拉查看课程大纲!
目标检测前沿8节课导师介绍
【个人背景】国内一线车企研究院资深算法工程师,擅长感知算法方向,在语义分割、车道线检测、2D和3D目标检测、BEV目标检测等领域,具有丰富的项目创新和落地经验。
【科研项目】曾主导多个重大项目,精通算法研究和部署端优化,以主要研究者身份,发表过CVPR多模态方向论文,在CV领域积累了多篇授权和落地专利。
👇🏻
扫码加助教
0元
预约直播课+开课立享
福利价!
开课可
领取
8节
《
2024目标检测前沿课程
》课件+
20
0
篇
目标检测精选论文&代码
unset