专栏名称: 有三AI
三人行必有AI,本公众号聚焦于让大家能够系统性地完成AI各个领域所需的专业知识的学习
目录
相关文章推荐
51好读  ›  专栏  ›  有三AI

【视频课】AI必学,超7小时,5大模块,掌握深度学习视觉Transformer模型理论与实践

有三AI  · 公众号  ·  · 2024-03-25 17:00

正文


前言


欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下:


第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用。

第2层: 掌握CV 算法最底层的能力,包括 CNN模型,Transformer模型,图像分类,模型分析。

第3层: 掌握CV 算法最核心的方向,包括 图像分割,目标检测,图像生成,目标跟踪。

第4层: 掌握CV 算法最核心的应用,包括 人脸图像,图像质量,视频分析,图像编辑。

第5层: 掌握算法落地的关键技术 ,包括模型优化,模型部署


其中部分课程的主体内容已经更新完毕,比如数据使用/模型分析/图像分类/图像分割/目标检测/图像生成/图像翻译/视频分类/模型部署/模型优化/人脸图像检测与识别/ 人脸图像属性编辑 ;部分课程正在重制更新中,比如三维人脸重建;部分课程正在计划上线中,比如图像编辑,请大家及时关注!


最新的完整介绍如下: 【总结】最专业最系统的CV内容,有三AI所有免费与付费的计算机视觉课程汇总(2022年8月)



本次给大家介绍的课程内容是 《深度学习之视觉Transformer模型:理论实践篇》,目标是帮助 大家掌握Transformer模型以及各类常见的Vision Transformer模型的原理与实践


为什么要学习这门课


随着Transformer模型的诞生,自然语言处理领域进入了预训练模型时代,随后研究者开始将 Transformer模型迁移到计算机视觉领域,并在学术上取得了许多进展,提出了各种各样的Vision Transformer模型,在性能上不输CNN模型


这两年GPT等大语言模型的进展深刻地改变了行业,国内外涌现出了数以千计的大模型与相关的创业公司,ChatGPT等综合性聊天机器人改变了大家的工作习惯。


ChatGPT工具


在视觉领域,以Stable Diffusion等模型为代表的文生图框架也引领了新一代生成式技术的发展,AI创作的图片和短视频如今遍布互联网,其质量已达到商业化落地水平。


Stable Diffusion生成效果图


不管是大语言模型还是视觉大模型,其背后不可缺少的核心模型是Transformer。 为了帮助大家掌握好 Transform er以及Vision Transform er的原理与实践 ,我们推出了 《深度学习之视觉 Transform er :理论与实践》系列课程 ,目前 已完成超过了7个小时内容,约450分钟(还在更新中)


课程内容介绍


本课程内容 涵盖了 自注意力原理,Transformer的原理与实现,各类Vision Transformer的原理与实现,以及Vision Transformer的训练等内容 ,既有足够的宽度,也具备有足够的深度。我们 会非常详细地讲解算法中的细节,帮助彻底消化算法原理;


下图是已有课程的大纲脑图,共分为5大模块。



下面简单了解一下各部分的内容:


(1) Transformer,包括自注意力原理, Transform er原理以及从零进行代码实现 ,约135分钟,超过两个小时,本部分内容可以免费学习。

(2) 基础Vision Transformer模型 ,包括 ViT与Simple ViT模型 原理 ,Dei T模型 原理,从零实现 ViT与Simple ViT模型, Dei T模型, 约100分钟。

(3) 深度 Vision Transformer模型 ,包括DeepViT原理与实现 CaiT原理与实现 约80分钟。







请到「今天看啥」查看全文