专栏名称: 计算机视觉life
兼具系统性、严谨性、易读性,分享计算机视觉、机器学习、人工智能及相关领域前沿资讯、技术干货、产业理解。
目录
相关文章推荐
51好读  ›  专栏  ›  计算机视觉life

终于有人把计算机视觉讲明白了 !

计算机视觉life  · 公众号  ·  · 2021-05-28 08:00

正文

说到“深度学习”,它的最明显的特色就是“深”,并且通过很深层次的网络,来实现准确率非常高的图像识别、语音识别等能力。因此,我们就会觉得深的网络比浅的网络好,从而网络被设计的越来越深。

但是, 随着网络的加深,训练集准确率却逐渐下降 ,这与最初的设想背道而驰。这时,出现了一个全新的网络,使这种准确率变得良好起来,它就是深度残差网络(ResNet)。

那么,为什么ResNet可以解决“随着网络加深,准确率不下降”的问题?


01

突 现


ResNet是一个由微软开发的深度卷积网络,它赢得了2015 年的ImageNet图像分类任务竞赛第一名, 将网络深度提升到了152层,错误率降到了3.57 ,这是前所未有的。

ResNet是非常强大的骨干模型,经常在许多计算机视觉任务中使用, 现在一些大厂的图像识别工程师, 经常运用到ResNet。 ResNet最根本的突破在于它使得我们可以训练成功非常深的神经网络。


02

发 展


在ResNet没有出现之前,梯度消失问题非常严重。例如,在中间层增加辅助损失作为额外的监督,其实也很难达到效果,这时候训练较深的神经网络非常困难的。

而用残差学习来解决退化问题,是因为残差学习相比原始特征直接学习更容易, ResNet的核心思想是引入所谓的“恒等映射捷径连接(identity shortcut connection)” ,可以跳过一层或多层会使得堆积层在输入特征基础上学习到新的特征,从而拥有更好的性能。


03

实 用


ResNet有很好的实用性,如果我们在做图像分类任务中的人脸表情识别,可以很好的运用ResNet, 我们先使用深度卷积神经网络来提取图像特征,然后用ResNet作为分类模型,来完成人脸表情识别的任务。

从ResNet原理入手,你可以 一窥人工智能技术。


04

机 遇


ResNet在研究界越来越受到欢迎, 俨然迅速成为计算机视觉任务中主流架构。 但是,往往我们在自学ResNet的时候,会对网络结构难以理解,那么,我们应该如何顺利掌握CNN、ResNet,正确掌握计算机视觉CV要领呢?

其实,ResNet的原理与应用并不难,你只需要跟对老师,上对课程。这里给大家推荐一门由 前IBM中国总部数据科学家高民权老师为大家授课的《深度详解CNN经典模型:ResNet原理与应用》课程,两天时间手把手带你coding代码实战,掌握计算机视觉要领。


2天时间,掌握CV要领▼


扫描下方二维码即可报名👇

即可掌握计算机视觉要领


05

课 程


2天时间,高老师从传统分类问题思路入手,讲解逻辑回归与滤波器的优点与不足,引出卷积神经网络的优势与基本操作,最后展开讲述ResNet的应用、项目实现与前沿发展。


从CNN、ResNet原理讲起,开启你的计算机视觉学习之路。 并且搭建ResNet实现一个表情识别任务。


课程大纲:


06

名 师


这次训练营的讲师是高民权老师,他从2018年至今,培养过诸多AI算法工程师,高老师的教学核心观点就是 “理解原理 + 实战实现” 。计算机科学里有一句话比较直接,叫 “No BB, show me your code” , 是的,这也是高老师的教学风格,就是尽量让大家能通过代码,真正了解事物的原理。







请到「今天看啥」查看全文