专栏名称: 计算机视觉研究院
主要由来自于大学的研究生组成的团队,本平台从事机器学习与深度学习领域,主要在人脸检测与识别,多目标检测研究方向。本团队想通过计算机视觉战队平台打造属于自己的品牌,让更多相关领域的人了解本团队,结识更多相关领域的朋友,一起来学习,共同进步!
目录
相关文章推荐
51好读  ›  专栏  ›  计算机视觉研究院

当YOLO遇上Mamba,魔改双王者炸了!

计算机视觉研究院  · 公众号  ·  · 2024-07-08 14:00

正文

今年多次霸榜的Mamba,作为一种新的选择性状态空间模型,对主流架构Transformer提出了挑战, 被视为极具潜力的CV基础模型! 基于Mamba的改进变体也层出不穷,近期甚至出现 Mamba-YOLO模型,目标检测性能超越了YOLO所有版本! 2024上半年相关论文已近百篇, VideoMamba、MambaIR、ZigMa等多个模型,也被 刚刚揭榜的ECCV'24接收

为了帮助大家掌握Mamba架构和性能,研梦非凡于 7月10日(周三), 邀请了手握多篇SCI一作、精通视觉语言模型的王导师,独家详解核心论文 《Mamba: Linear-Time Sequence Modeling with Selective State Spaces》(AI前沿直播课NO.52), 通过可视化的图解方式, 从Transfomer、RNN原理回顾,再到SSM、Mamba重点解析,并进行全面对比, 1节课速通Mamba改进核心知识点!

👇🏻 扫描二维码找助教0元 预约 直播课!

凡预约即可领取 2024年 5 7篇M amba 改进/综述论文 (图像视频、3D点云、多模态等热门方向) +83篇ECCV'24收录论文 + 文末还有算力等科研福利


unset unset 直播课内容概览 unset unset

01 Transfomer

  1. Transformer原理
  2. Transformer的优点
  3. Transformer的核心组件
  4. Transformer的推理

02 RNN

  1. RNN介绍
  2. RNN的问题
  3. RNN vs Transformer

03 SSM

  1. 什么是状态空间
  2. 什么是状态空间模型
  3. 从连续信号到离散信号
  • 循环表示
  • 卷积表示
  • 三种表示

04 Mamba(直播课重点)

  1. SSM的局限
  2. Mamba介绍
  3. 扫描操作
  4. Mamba vs Transformer vs RNN

05 总结展望

  1. Vision Mamba等

导师介绍

王导师

【学术背景】985硕出身,拥有丰富的深度学习研究、论文发表经验,多篇SCI论文、EI会议论文(一作)

【研究方向】大语言模型、视觉语言模型、多模态学习,以及自然语言处理、进化算法等

直播福利

参加本次直播的同学都将获得 1小时导师meeting 的福利(助教+导师)! 原价2999, 限时福利价9.9元! 活动时间为 7月10日到7月31日。

ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松完成论文报告。

👇🏻 扫描二维码找助教0元 预约 直播课!

凡预约即可领取 2024年 5 7篇M amba 改进/综述论文 (图像视频、3D点云、多模态等热门方向) +83篇ECCV'24收录论文 + 文末还有算力等科研福利



unset unset 研梦非凡科研论文指导 unset unset

如果你的研究方向/方法/idea是属于 CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向, 如果你需要发 CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等, 都可以来研梦非凡,匹配合适的科研指导。

研梦非凡可指导的研究方向

主流方向科研论文常用方法

研梦非凡现有idea

👇🏻 扫码找助教了解更多/验证自己的idea是否可行


unset unset 研梦非凡科研论文指导方案 unset unset

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。 研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。 授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!
<< >>>
👇🏻






请到「今天看啥」查看全文