专栏名称: 有三AI
三人行必有AI,本公众号聚焦于让大家能够系统性地完成AI各个领域所需的专业知识的学习
目录
相关文章推荐
51好读  ›  专栏  ›  有三AI

【一对一小组】2025年有三AI-CV初阶-基础算法组发布,助力夯实深度学习图像识别算法理论与实践

有三AI  · 公众号  ·  · 2025-02-10 15:50

正文



2025年有三AI-CV初阶-基础算法组 正式发布! 有三AI已经推出了CV初-中-高级培养计划( 原名有三AI-CV季划 ),这是我们的终身计算机视觉学习小组。

该培养计划具有以下特点:

【系统性】配套有非常完备的理论与实践

【永久性】不限制学习期限,一直有效

【成长性】内容保持更新,不额外收费

【专业性】原创书+视频讲解+真实项目锻炼

【丰富性】数千页PPT,文档,项目等

【权威性】工业界资深背景辅导老师,弱运营属性


什么是有三AI-CV初阶-基础算法组


本组针对深度学习与计算机视觉学习新手,目标是从Python编程、Pytorch框架使用与深度学习开始,到较为深入系统地掌握计算机视觉的核心领域,培养出独立完整的CV算法研发与工程项目能力。 下图是2025年CV初阶-基础算法组包括的内容预览图,可以自行放大仔细阅读。


学习内容覆盖以下几个方向:


(1 ) 编程基础,包括 Python使用、 开源框架Pytorch 的使用。

(2) 数据使用 ,包括 数据获取、 数据整理、数据标注、数据增强。

(3) 计算机核心算法方向深入掌握,包括 图像分类、图像分割、目标检测、CNN模型、Vision Transformer模型、GAN模型、扩散模型。


学习资源包括以下部分:


(1) 可选的1本配套图书教材,《深度学习之图像识别:核心算法与实战案例(全彩版)》,推荐入手。



(2) 配套的 视频教 程,唯一的学习平台,课程不定期更新



(3) 有三AI项目研发组进入权限,有机会负责真实产业案例研发。



编程与开源框架部分


Python在各类编程语言中是最适合新手学习的一门语言,也是当下人工智能科学研究与应用领域中使用最为广泛的语言,当前几乎所有的机器学习与深度学习开源研究项目都基于Python语言编写。

要学人工智能,必先学Python!为了帮助一些新手逐渐掌握Python的使用,我们 配置了一套3个小时的Python课程。

课程详情可见:【视频课】纯新手如何快速掌握深度学习必备的Python基础能力,150分钟助你入门!


Pytorch是当下最流行的深度学习开源框架,我们所有的项目都是使用Pytorch框架,因此是我们必须要掌握的内容, 我们 配置了一套5个小时的Pytorch课程。

课程详情可见: 【视频课】永久免费!5小时快速掌握Pytorch框架入门及实战


深度学习基础


深度学习必须 夯实的理论 基础,有三之前给 阿里云开发了《深度学习原理与实践》基础课程,讲述了深度学习的大部分基础内容,内容深度和宽度都足够让初学者掌握好深度学习基础,介绍和地址如下:
【完结】有三AI&阿里云的深度学习基础课程暂时完结,欢迎扩散学习
大家可以到阿里云平台学习,也可以到我们课程平台去学习。

数据使用


数据的使用是深度学习算法领域从业者的必备素质,需要掌握如何收集高质量的数据,如何整理数据,如何分析数据,如何在各类项目中使用好数据增强。我们配置了 1门时长超过3小时的《深度学习之数据使用》课程与若干个项目实践

课程详情可见: 【视频课】永久免费!3小时快速掌握深度学习CV数据使用核心内容


图像分类


对于刚接触深度学习计算机视觉的初学者来说,图像分类问题是最常见的问题,如何做好图像分类任务,关系到大家能否正确顺利地入门、如何学习接下来更加高阶的内容。 我们配置了图像分类课程,当前包含的内容共约12个小时,PPT数量超过300页。

(1) 理论部分 :涵盖了深度学习图像分类各个方向的理论知识,如 图像分类基础、多类别图像分类理论、细粒度图像分类理论、多标签图像分类理论、半监督与无监督图像分类、零样本图像分类 等,既有足够的广度,也具备足够的深度。

(2) 实践部分 本次课程中一共已经包含了5个实践案例,分别为 从零完成人脸表情识别案例实践 、简单图像分类数据增强实战、鸟类动物细粒度分类实战、生活用品多标签图像分类实战、基于血红细胞的图像分类竞赛技巧 ,通过这些实战案例可以彻底掌握图像分类任务的实战技巧。

课程详情可见: 【视频课】CV必学,超10小时,3大模块,5大案例,循序渐进地搞懂图像分类理论与实践!


图像分割


图像分割是在图像分类基础上更加细粒度的像素级分类问题,在视频直播,电商推荐,自动驾驶,医学图像等行业中有着广泛的应用,是深度学习计算机视觉领域中非常底层的问题,也是必须掌握的核心算法,包含的东西非常多。 我们配置了 图像分割课程,当前包含的内容共约12个小时,PPT数量超过400页。

(1) 理论部分 :涵盖了深度学习之图像分割的各个研究方向,如 图像分割基础、语义分割模型及其改进技术、弱监督语义分割,Image Matting经典模型及其改进,各类实例分割模型 等,既有足够的宽度,也具备有足够的深度。

(2) 实践部分 本次课程中一共已经包含了4个实践案例,分别为 人脸嘴唇分割实战,缺陷分割实战,Image Matting人像抠图实战,Mask RCNN实例分割实战, 部分案例结果图如下:

课程详情可见: 【视频课】CV必学,超10小时,3大模块,4大案例,循序渐进地搞懂图像分割!

目标检测


目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。 我们配置了 目标检测课程,当前包含的内容共约28个小时,PPT数量约400页。

(1) 理论部分 two-stage算法-Faster RCNN系列详解、one-stage算法-YOLO系列详解(从YOLO v1到YOLO v5),Anchor-free算法系列详解(包括Densebox,CenterNet,CornetNet等);会非常详细地讲解算法中的细节,帮助彻底消化算法原理;


(2) 实践部分 本次课程中一共已经包含了4个实践案例, YOLOv3实战(工业缺陷检测) Faster-RCNN实战(猫脸检测),CenterNet(电路板缺陷检测),MMdetection框架使用;

课程详情可见 【视频课】CV必学,超30小时,4大模块,4大案例,循序渐进地搞懂目标检测!

CNN模型设计


模型的设计是整个深度学习领域的通用基础,不管是从头设计自己的神经网络,还是对已有模型进行优化获得更高的任务指标,更快的运行速度,获得更小的模型体积,都需要掌握各类网络的设计技巧,是深度学习算法工程师进阶的难点及必学点! 我们配置了 模型设计课程,当前包含的内容超过20个小时,PPT数量超过450页。

理论部分

(1) 基于网络深度的CNN模型设计 ,内容包括 经典浅层卷积网络的设计模型如neocognitron、经典模型AlexNet,VGGNet,ResNet

(2) 基于网络宽度的CNN模型设计, 内容包括 多分支经典模型如GoogLeNet,ResNext等

(3) 经典注意力机制 CNN模型设计, 内容 包括 空间注意力模型、通道注意力模型、 混合注意力模型

(3) 轻量级模型设计, 内容 包括 Xception网络、MobileNet V1和V2网络、 ShuffleNet V1和V2网络、SqueezeNet网络

实践部分: 本次课程中一共已经包含了4个实践案例, 基于ResNet的垃圾分类实战,基于InceptionNet系列的花卉分类实战,基于SeNet的人种分类实战,Pytorch模型安卓端部署。


详细了解课程,请阅读: 【视频课】AI必学,超20小时,4大模块,循序渐进地搞懂CNN模型设计与简单部署!

Vision Transformer模型


随着Transformer模型的诞生,自然语言处理领域进入了预训练模型时代,随后研究者开始将Transformer模型迁移到计算机视觉领域,并在学术上取得了许多进展,提出了各种各样的Vision Transformer模型,在性能上不输CNN模型。 不管是大语言模型还是视觉大模型,其背后不可缺少的核心模型是Transformer。
我们配置了






请到「今天看啥」查看全文