专栏名称: 有三AI
三人行必有AI,本公众号聚焦于让大家能够系统性地完成AI各个领域所需的专业知识的学习
目录
相关文章推荐
51好读  ›  专栏  ›  有三AI

【一对一小组】2025年有三AI-CV初阶-基础算法组发布,助力夯实深度学习图像识别算法理论与实践

有三AI  · 公众号  ·  · 2025-02-10 15:50

正文

请到「今天看啥」查看全文




2025年有三AI-CV初阶-基础算法组 正式发布! 有三AI已经推出了CV初-中-高级培养计划( 原名有三AI-CV季划 ),这是我们的终身计算机视觉学习小组。

该培养计划具有以下特点:

【系统性】配套有非常完备的理论与实践

【永久性】不限制学习期限,一直有效

【成长性】内容保持更新,不额外收费

【专业性】原创书+视频讲解+真实项目锻炼

【丰富性】数千页PPT,文档,项目等

【权威性】工业界资深背景辅导老师,弱运营属性


什么是有三AI-CV初阶-基础算法组


本组针对深度学习与计算机视觉学习新手,目标是从Python编程、Pytorch框架使用与深度学习开始,到较为深入系统地掌握计算机视觉的核心领域,培养出独立完整的CV算法研发与工程项目能力。 下图是2025年CV初阶-基础算法组包括的内容预览图,可以自行放大仔细阅读。


学习内容覆盖以下几个方向:


(1 ) 编程基础,包括 Python使用、 开源框架Pytorch 的使用。

(2) 数据使用 ,包括 数据获取、 数据整理、数据标注、数据增强。

(3) 计算机核心算法方向深入掌握,包括 图像分类、图像分割、目标检测、CNN模型、Vision Transformer模型、GAN模型、扩散模型。


学习资源包括以下部分:


(1) 可选的1本配套图书教材,《深度学习之图像识别:核心算法与实战案例(全彩版)》,推荐入手。



(2) 配套的 视频教 程,唯一的学习平台,课程不定期更新



(3) 有三AI项目研发组进入权限,有机会负责真实产业案例研发。



编程与开源框架部分


Python在各类编程语言中是最适合新手学习的一门语言,也是当下人工智能科学研究与应用领域中使用最为广泛的语言,当前几乎所有的机器学习与深度学习开源研究项目都基于Python语言编写。

要学人工智能,必先学Python!为了帮助一些新手逐渐掌握Python的使用,我们 配置了一套3个小时的Python课程。

课程详情可见:【视频课】纯新手如何快速掌握深度学习必备的Python基础能力,150分钟助你入门!


Pytorch是当下最流行的深度学习开源框架,我们所有的项目都是使用Pytorch框架,因此是我们必须要掌握的内容, 我们 配置了一套5个小时的Pytorch课程。

课程详情可见: 【视频课】永久免费!5小时快速掌握Pytorch框架入门及实战


深度学习基础


深度学习必须 夯实的理论 基础,有三之前给 阿里云开发了《深度学习原理与实践》基础课程,讲述了深度学习的大部分基础内容,内容深度和宽度都足够让初学者掌握好深度学习基础,介绍和地址如下:
【完结】有三AI&阿里云的深度学习基础课程暂时完结,欢迎扩散学习
大家可以到阿里云平台学习,也可以到我们课程平台去学习。

数据使用


数据的使用是深度学习算法领域从业者的必备素质,需要掌握如何收集高质量的数据,如何整理数据,如何分析数据,如何在各类项目中使用好数据增强。我们配置了 1门时长超过3小时的《深度学习之数据使用》课程与若干个项目实践

课程详情可见: 【视频课】永久免费!3小时快速掌握深度学习CV数据使用核心内容


图像分类


对于刚接触深度学习计算机视觉的初学者来说,图像分类问题是最常见的问题,如何做好图像分类任务,关系到大家能否正确顺利地入门、如何学习接下来更加高阶的内容。 我们配置了图像分类课程,当前包含的内容共约12个小时,PPT数量超过300页。

(1) 理论部分 :涵盖了深度学习图像分类各个方向的理论知识,如 图像分类基础、多类别图像分类理论、细粒度图像分类理论、多标签图像分类理论、半监督与无监督图像分类、零样本图像分类 等,既有足够的广度,也具备足够的深度。

(2) 实践部分 本次课程中一共已经包含了5个实践案例,分别为 从零完成人脸表情识别案例实践 、简单图像分类数据增强实战、鸟类动物细粒度分类实战、生活用品多标签图像分类实战、基于血红细胞的图像分类竞赛技巧 ,通过这些实战案例可以彻底掌握图像分类任务的实战技巧。

课程详情可见: 【视频课】CV必学,超10小时,3大模块,5大案例,循序渐进地搞懂图像分类理论与实践!


图像分割


图像分割是在图像分类基础上更加细粒度的像素级分类问题,在视频直播,电商推荐,自动驾驶,医学图像等行业中有着广泛的应用,是深度学习计算机视觉领域中非常底层的问题,也是必须掌握的核心算法,包含的东西非常多。 我们配置了 图像分割课程,当前包含的内容共约12个小时,PPT数量超过400页。

(1) 理论部分 :涵盖了深度学习之图像分割的各个研究方向,如 图像分割基础、语义分割模型及其改进技术、弱监督语义分割,Image Matting经典模型及其改进,各类实例分割模型 等,既有足够的宽度,也具备有足够的深度。

(2) 实践部分 本次课程中一共已经包含了4个实践案例,分别为 人脸嘴唇分割实战,缺陷分割实战,Image Matting人像抠图实战,Mask RCNN实例分割实战, 部分案例结果图如下:

课程详情可见: 【视频课】CV必学,超10小时,3大模块,4大案例,循序渐进地搞懂图像分割!

目标检测


目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。 我们配置了 目标检测课程,当前包含的内容共约28个小时,PPT数量约400页。

(1) 理论部分 two-stage算法-Faster RCNN系列详解、one-stage算法-YOLO系列详解(从YOLO v1到YOLO v5),Anchor-free算法系列详解(包括Densebox,CenterNet,CornetNet等);会非常详细地讲解算法中的细节,帮助彻底消化算法原理;


(2) 实践部分 本次课程中一共已经包含了4个实践案例, YOLOv3实战(工业缺陷检测) Faster-RCNN实战(猫脸检测),CenterNet(电路板缺陷检测),MMdetection框架使用;

课程详情可见 【视频课】CV必学,超30小时,4大模块,4大案例,循序渐进地搞懂目标检测!

CNN模型设计


模型的设计是整个深度学习领域的通用基础,不管是从头设计自己的神经网络,还是对已有模型进行优化获得更高的任务指标,更快的运行速度,获得更小的模型体积,都需要掌握各类网络的设计技巧,是深度学习算法工程师进阶的难点及必学点! 我们配置了 模型设计课程,当前包含的内容超过20个小时,PPT数量超过450页。

理论部分

(1) 基于网络深度的CNN模型设计 ,内容包括 经典浅层卷积网络的设计模型如neocognitron、经典模型AlexNet,VGGNet,ResNet

(2) 基于网络宽度的CNN模型设计, 内容包括 多分支经典模型如GoogLeNet,ResNext等

(3) 经典注意力机制 CNN模型设计, 内容 包括 空间注意力模型、通道注意力模型、 混合注意力模型

(3) 轻量级模型设计, 内容 包括 Xception网络、MobileNet V1和V2网络、 ShuffleNet V1和V2网络、SqueezeNet网络

实践部分: 本次课程中一共已经包含了4个实践案例, 基于ResNet的垃圾分类实战,基于InceptionNet系列的花卉分类实战,基于SeNet的人种分类实战,Pytorch模型安卓端部署。


详细了解课程,请阅读: 【视频课】AI必学,超20小时,4大模块,循序渐进地搞懂CNN模型设计与简单部署!

Vision Transformer模型


随着Transformer模型的诞生,自然语言处理领域进入了预训练模型时代,随后研究者开始将Transformer模型迁移到计算机视觉领域,并在学术上取得了许多进展,提出了各种各样的Vision Transformer模型,在性能上不输CNN模型。 不管是大语言模型还是视觉大模型,其背后不可缺少的核心模型是Transformer。
我们配置了 Vision Transformer课程,当前包含的内容超过7个小时,PPT数量超过200页。

理论部分: (1) Transformer基础,包括自注意力原理,Transformer原理 (2) 基础ViT模型 原理 内容包括ViT模型 原理 ,SimpleViT模型 原理 ,DeiT模型 原理 (3) 深度ViT模型原理, 内容 包括DeepViT 模型 原理,CaiT 模型 原理 (4) 轻量级ViT模型 原理 内容 包括CCT模型原理,MobileViT 模型 原理 (5) 其他模型 原理,包括T2T模型。

实践部分: 从零实现 Transformer模型, 从零实现 ViT模型, 从零实现 DeiT模型, 从零实现CaiT模型, 从零实现DeepViT模型, 从零实现 CCT模型, 从零实现MobileViT 模型, 从零实现T2T 模型,通用ViT模型训练方法

图片


详细了解课程,请阅读: 【视频课】AI必学,超7小时,5大模块,掌握深度学习视觉Transformer模型理论与实践

图像生成GAN


GAN是非常重要的生成式模型,其应用涉及图像与视频生成,数据仿真与增强,各种各样的图像风格化任务,人脸与人体图像编辑,图像质量提升。 为了帮助初学者学习GAN用于图像生成领域的问题, 我们配置了 图像生成GAN课程,当前包含的内容超过6个小时,PPT数量超过200页。

理论部分 (1) 全卷积GAN模型 原理 (2) 条件生成GAN 模型 原理 (3 ) StyleGAN系列 模型原理 (4 ) 数据增强与仿真GAN 原理 (5)视频生成GAN 原理

实践部分: 本次课程中一共已经包含了2个实践案例, DCGAN人脸嘴唇表情生成模型搭建与训练,StyleGAN人脸图像生成 模型搭建与训练

图片


详细了解课程,请阅读: 【视频课】CV必学,超6小时,2大模块,循序渐进地搞懂GAN图像生成!

扩散模型基础


扩散模型是一种基于深度学习的生成模型,它通过模拟数据从原始状态逐渐加入噪声直至完全随机的过程(正向扩散),然后再从这个随机状态逐步去除噪声恢复出原始数据的过程(反向扩散)。正向扩散过程逐步破坏数据的结构,而反向扩散过程则学习如何重建这些结构 。扩散模型在图像生成、文本到图像的转换、音频合成等领域表现出色,是当下AIGC领域,尤其是文生图、文生视频等领域中的基础模型。
我们配置了扩散模型基础 课程,当前包含的内容超过2个小时。

理论部分 (1) 扩散模型 原理 (2)DDPM算法原理与数学推导

实践部分: 本次课程中包含了 1 个实践案例, 从零实现DDPM模型搭建与训练

图片

详细了解课程,请阅读: 【视频课】永久免费课程!如何掌握好扩散模型的基础理论与实践

如何学以致用


有三AI-CV学习小组的目标不仅是让学习者完成对深度学习CV算法知识的掌握,更是要在实际项目中进行使用,因此提供了学习后的一些输出形式,包括 做项目、授课 等。关于 产出形式,下面是一些往期成员的分享,供大家参考:

【杂谈】有三AI季划的最核心价值在哪,听听这些同学怎么说!
【杂谈】我在有三AI从学生到老师
【杂谈】从学员到开发者,我在有三AI打怪升级
【杂谈】有三AI课程兼职讲师,打造自己的影响力,我从这里开始!
【杂谈】蛰伏3年,从学习到负责适合自己方向的项目研发
【杂谈】一个项目获得10倍学费收入,我在有三AI学以致用的故事
【杂谈】从学员到合作伙伴,我与有三AI不得不说的故事
【杂谈】从学员到参与书籍写作,我在有三AI学习与成长的故事
【杂谈】从学员到专栏作者、讲师,我在有三AI学习与名利双收的故事
【杂谈】从学生到讲师,我如何20天里在有三AI赚3万
【杂谈】从失业到重要项目负责人,2020年里我如何在有三AI上岸
【杂谈】参加有三AI秋季划4个月,薪资翻倍,我在有三AI都学了啥?
【杂谈】一个五岁孩子妈妈在有三AI学习并且赚钱的故事
【杂谈】有三AI-CV春季划有用吗,听听他们的分享
【杂谈】从医学专业转行到AI,独立完成项目到获得加州理工大学读研推荐,我如何与有三AI结缘

如何报名


直接订阅下面的有三AI-CV初阶-基础算法组专栏即可, 此后内容增加也不会新增费用。 订阅后联系有三微信 Longlongtogo 获得其他内容。

关于学习方式


有三AI-CV初阶-基础算法组学习方式非常自由,包括:
(1) 按照给出的路线和学习资料,分视频,书籍,代码实践3部分可自主把控学习进度,不限制学习时间,永久有效,新增内容会在群里通知。
(2) 微信群答疑,有三一对一微信答疑和线下答疑。
(3) 参与内容组,兼职当老师进行锻炼。参与项目组,做真实项目获得收入 进行锻炼

往期相关








请到「今天看啥」查看全文