专栏名称: 算法爱好者

算法是程序员的内功！伯乐在线旗下账号「算法爱好者」专注分享算法相关文章、工具资源和算法题，帮程序员修炼内功。

基于深度学习的计算机视觉，案例分析学习！

算法爱好者 · 公众号 · 算法 · 2017-05-03 22:42

正文

立即参团

原价 ¥899.00

100人以上 ¥499.00

200人以上 ¥399.00

现已达最低价

前往文末加客服参团

课程名称

《基于深度学习的计算机视觉》第一期

主讲老师

张宗健悉尼科技大学计算机视觉博士：

曾任职澳大利亚联邦科学与工业研究院（CSIRO ）研究工程师，Vancl技术中心研究院图像研发工程师，研究领域为计算机视觉，具体涉及：图像场景理解、图像语言问题、深度神经网络、图像检索、Human ReID、数据分析及预测、信号模式识别等。

课程描述

1. 基本理解计算机视觉中针对图像的重要研究问题。由浅及深得讲解图像的存储、预处理、特征提取、以及学术界和工业界中的主要应用问题。

2. 重点介绍深度学习的神经网络（DNN）模型在计算机视觉领域的应用。具体涉及在计算机视觉领域如何应用卷积神经网络（CNN）、区域卷积网络（R-CNN）、全卷积网络（FCN）、长短时记忆网络（LSTM）、生成对抗网络（GAN）等解决图像应用的难点。

3. 课程将使用Python语言及深度网络框架Tensorflow进行案例实践教学。

学习收益

1. 循序渐进得学习计算机视觉中的一些重要研究问题

2. 学习不同深度神经网络（DNN）模型在计算机视觉的成功应用

3. 了解DNN的设计及改进思路

4. 学习深度学习框架Tensorflow的基本使用

开课时间

2017年5月12日，共10次，每次2小时

学习方式

在线直播，共10次

每周2次（周一、周五晚20:00-22:00）

直播后提供录制回放视频

可在线反复观看，有效期1年

课程大纲

第一讲课题介绍/Introduction

1. 主要研究问题

2. 开源库介绍（OpenCV，Caffe，Theano，Tensorflow，Torch等）

3. 应用案例：基于Python语言的OpenCV库配置

第二讲图像数据处理/Image Data Processing

1. 空域分析及变换（Sobel，拉普拉斯，高斯，中值等）

2. 频域分析及变换（Fourier & Wavelet Transform）

3. 模板匹配，金字塔，滤波器组

4. 主成分分析/PCA，奇异值分解/SVD，聚类/Cluster

5. 应用案例：人脸检测方法——基于OpenCV库

第三讲图像特征与描述/Image Feature & Descriptor

1. 颜色特征（RBG，HSV，Lab等）

2. 几何特征（Edge，Corner，Blob等）

3. 纹理特征（HOG，LBP，Gabor等）

4. 局部特征（SIFT，SURF，FAST等）

5. 应用案例：虚拟现实的图像拼接（Image Stitching）

第四讲图像识别之图像分类/Image Classification

1. 卷积神经网络介绍/CNN（AlexNet, VGG, GoogLeNet, ResNet）

2. 图片分类/Image Classification

3. 场景分类/Scene Classification

4. ILSVRC（Imagenet Large Scale Visual Recognition Challenge ）竞赛之分类问题

5. 应用案例：图片分类之残差神经网络ResNet

第五讲图像识别之图像检测/Image Detection

1. 区域卷积神经网络/R-CNN（SPPnet，Fast/Faster R-CNN，R-FCN）

2. 物体检测/object detection & localization

3. 行人检测/pedestrian detection

4. 人脸检测/face detection

5. ILSVRC竞赛之物体检测及定位问题

6. 应用案例：人脸检测的Faster R-CNN应用（快速版区域卷积神经网络）

第六讲图像分割/Image Segmentation

1. 显著性检测/Saliency Detection

2. 物体分割/Object Segmentation（GraphCut，GrabCut等）

3. 语义分割/Semantic Segmentation（FCN，CRF/MRF）

4. PASCAL VOC竞赛介绍

5. 应用案例：自动驾驶场景图片的语义分割——全卷积网络DeepLab

第七讲图像描述（图说）/Image Captioning

1. 深度语言模型介绍（Vanilla-RNN，LSTM，GRU）

2. LSTM原理解析

3. 图说模型原理与结构

4. 大数据集介绍（MSCOCO，Flickr8K，Flickr30k）

5. 应用案例：图说智能(图像标注）的应用——Show and Tell

第八讲图像问答/Image Question Answering

1. 与图像描述的区别

2. 大数据集介绍（VQA，Visual Genome）

3. 图像问答模型原理及结构

4. 模型增强：注意力机制及外部知识库

5. 应用案例：图像智能问答的应用模型堆栈注意网络Stacked Attention Networks（SANs）

第九讲图像生成/Image Generation

1. 对抗生成网络（GAN）

2. GAN在图像生成中的应用（图片分布学习、以文生图）

3. GAN在传统问题中的应用（超分辨、语义分割）

4. 应用实例：图像复原的超分辨（SRGAN）模型应用

第十讲图像检索/Content-based Image Retrieval

1. 检索特征（颜色，纹理，形状，局部特征，Bag of Visual Words）

2. 特征相似度

3.大数据集下的索引加速技术（KD-tree，Locality Sensitive Hash）

4. 双向检索技术（以图搜图&以文搜图）

5. 应用案例：图像检索之开源库Lire （Lucence Image Retrieval）的应用

常见问题

Q：本门课程需要什么基础 ?

A：有较好的数学基础，掌握python。

Q：课程中挑选的案例都是什么？

A：ILSVRC竞赛是ImageNet Large Scale Visual Recognition Competition。PASCAL VOC竞赛是pattern analysis,statistical modelling and computational learning visual object classes。所使用数据集是目前计算机视觉领域最权威数据集。

Q：课程中会使用哪些软件工具？会提供课程里使用的代码吗？

A：使用OpenCV，Tensorflow等开源软件；会提供代码给学员。

Q：会有实际上机演示和动手操作吗？

A：有的，老师会在相关课时准备上机演示部分，学员可以学习老师的实践经验

Q：学习过程中，有疑问怎么解决？

A：可以在http://wenda.chinahadoop.cn/，老师会解答；也可以在群里和同学讨论

Q：在哪里上课？

A：课程直播和回放都在小象学院官网（http://www.chinahadoop.cn）上进行，不需要其他直播软件；如果希望上下班路上观看，可以下载小象学院app进行缓存。

长按扫码加客服——参团，咨询，查看课程