专栏名称: 有三AI
三人行必有AI,本公众号聚焦于让大家能够系统性地完成AI各个领域所需的专业知识的学习
目录
相关文章推荐
德州晚报  ·  2025年首次降价,就在今晚! ·  7 小时前  
山东省交通运输厅  ·  山东高速集团齐鲁高速安全体验基地建成并投入运营 ·  19 小时前  
山东省交通运输厅  ·  山东港口2025年世界级海洋港口群建设(烟台 ... ·  昨天  
51好读  ›  专栏  ›  有三AI

【视频课】AI必学,超7小时,5大模块,掌握深度学习视觉Transformer模型理论与实践

有三AI  · 公众号  ·  · 2024-03-25 17:00

正文


前言


欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下:


第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用。

第2层: 掌握CV 算法最底层的能力,包括 CNN模型,Transformer模型,图像分类,模型分析。

第3层: 掌握CV 算法最核心的方向,包括 图像分割,目标检测,图像生成,目标跟踪。

第4层: 掌握CV 算法最核心的应用,包括 人脸图像,图像质量,视频分析,图像编辑。

第5层: 掌握算法落地的关键技术 ,包括模型优化,模型部署


其中部分课程的主体内容已经更新完毕,比如数据使用/模型分析/图像分类/图像分割/目标检测/图像生成/图像翻译/视频分类/模型部署/模型优化/人脸图像检测与识别/ 人脸图像属性编辑 ;部分课程正在重制更新中,比如三维人脸重建;部分课程正在计划上线中,比如图像编辑,请大家及时关注!


最新的完整介绍如下: 【总结】最专业最系统的CV内容,有三AI所有免费与付费的计算机视觉课程汇总(2022年8月)



本次给大家介绍的课程内容是 《深度学习之视觉Transformer模型:理论实践篇》,目标是帮助 大家掌握Transformer模型以及各类常见的Vision Transformer模型的原理与实践


为什么要学习这门课


随着Transformer模型的诞生,自然语言处理领域进入了预训练模型时代,随后研究者开始将 Transformer模型迁移到计算机视觉领域,并在学术上取得了许多进展,提出了各种各样的Vision Transformer模型,在性能上不输CNN模型


这两年GPT等大语言模型的进展深刻地改变了行业,国内外涌现出了数以千计的大模型与相关的创业公司,ChatGPT等综合性聊天机器人改变了大家的工作习惯。


ChatGPT工具


在视觉领域,以Stable Diffusion等模型为代表的文生图框架也引领了新一代生成式技术的发展,AI创作的图片和短视频如今遍布互联网,其质量已达到商业化落地水平。


Stable Diffusion生成效果图


不管是大语言模型还是视觉大模型,其背后不可缺少的核心模型是Transformer。 为了帮助大家掌握好 Transform er以及Vision Transform er的原理与实践 ,我们推出了 《深度学习之视觉 Transform er :理论与实践》系列课程 ,目前 已完成超过了7个小时内容,约450分钟(还在更新中)


课程内容介绍


本课程内容 涵盖了 自注意力原理,Transformer的原理与实现,各类Vision Transformer的原理与实现,以及Vision Transformer的训练等内容 ,既有足够的宽度,也具备有足够的深度。我们 会非常详细地讲解算法中的细节,帮助彻底消化算法原理;


下图是已有课程的大纲脑图,共分为5大模块。



下面简单了解一下各部分的内容:


(1) Transformer,包括自注意力原理, Transform er原理以及从零进行代码实现 ,约135分钟,超过两个小时,本部分内容可以免费学习。

(2) 基础Vision Transformer模型 ,包括 ViT与Simple ViT模型 原理 ,Dei T模型 原理,从零实现 ViT与Simple ViT模型, Dei T模型, 约100分钟。

(3) 深度 Vision Transformer模型 ,包括DeepViT原理与实现 CaiT原理与实现 约80分钟。

(4) 轻量级ViT模型 ,包括 Compact ViT原理与实现 MobileViT原理与实现 约90分钟。

(5) ViT模型训练 实战,包括适用于课程中所有ViT模型训练的通用代码模板讲解, 约20分钟。

(6) 其他内容 ,如Token2Token模型原理讲解与从零实现等, 时长约30分钟。


本课程讲师为言有三,讲师简介如下:








请到「今天看啥」查看全文