专栏名称: 云技术实践

关注云计算，云技术，云运维，云存储，存储，分布式，OpenStack，SDN，Ceph，虚拟化，运维，分享在云计算/虚拟化/运维项目实施中的资讯、经验、技术，坚持干货。

零基础认识深度学习猿人的第一次直立行走

云技术实践 · 公众号 · 架构 · 2017-10-21 20:01

正文

前言

人工智能是当今的热议行业，深度学习是热门中的热门，浪尖上的浪潮，但对传统IT从业人员来说，人工智能技术到处都是模型、算法、矢量向量，太晦涩难懂了。所以我写了这篇入门级科普文章，目标是让IT从业者能看清读懂深度学习技术的特点，以及我们如何从中受益，找到自己的工作。

第一. 人工智能的天时地利人和

行业的成熟要靠从业者的奋斗（人和）,也要考虑大环境和历史的进程（天时和地利）。

人工智能技术的井喷并不是单纯的技术进步，而是软件、硬件、数据三方面共同努力水到渠成的结果，深度学习是AI技术的最热分支，也是受这三方面条件的限制。

AI软件所依赖的算法已经存在很多年了，神经网络是50年前提出的技术，CNN/RNN等算法比大部分读者的年龄都要大。AI技术一直被束之高阁，是因为缺乏硬件算力和海量数据。随着CPU、GPU、FPGA硬件的更新，几十年时间硬件算力扩充了万倍，硬件算力被逐渐解放。随着硬盘和带宽的降价提速，20年前全人类都没几张高清照片，现在单个公司的数据量就能达到EB级。大数据技术只能读写结构化日志，要读视频和图片必须用AI，人类已经盯不过来这么多摄像头了。

我们只有从心里把AI技术请下神坛，才能把它当做顺手的工具去用。AI的技术很深理论很晦涩，主要是这个行业刚刚发芽还未分层，就像20年前IT工程师需要全面掌握技能，现在的小朋友们连字符集都不用关注。

第二. 关联度模型

深度学习有两步工作，先要训练生成模型，然后使用模型去推测当前的任务。

比如说我用100万张图片标记好这是猫还是狗，AI把图片内各个片段的特征提取出来，生成一个猫狗识别模型。然后我们再给这个模型套上接口做成猫狗检测程序，每给这个程序一张照片它就能告诉你有多大几率是猫多大几率是狗。

这个识别模型是整个程序中最关键的部分，可以模糊的认为它就是一个密封黑盒的识别函数。以前我们写程序都是做if-then-else因果判断，但图像特征没有因果关系只看关联度，过去的工作经验反而成了新的认知障碍，还不如就将其当做黑盒直接拿来用。

接下来我放一个模型训练和推测的实验步骤截图，向大家说明两个问题：

1.需要用客户的现场数据做训练才能出模型，训练模型不是软件外包堆人日就行，很难直接承诺模型训练结果。

2.训练模型的过程很繁琐耗时，但并不难以掌握，其工作压力比DBA在线调试SQL小多了，IT工程师在AI时代仍有用伍之地。

第三. 动手实验

本节较长，如果读者对实验步骤和结果没兴趣，而是直接想看我的结论，也可以跳过这一节。

这个实验是Nvidia提供的入门培训课程——ImageClassification with DIGITS - Training a model。

我们的实验很简单，用6000张图片去训练AI识别0-9这几个数字。