专栏名称: InfoQ
有内容的技术社区媒体。
目录
51好读  ›  专栏  ›  InfoQ

是时候让最热的“深度学习”真正落地到实际开发中了!丨课程推广

InfoQ  · 公众号  · 科技媒体  · 2017-05-13 09:01

正文

深度学习有多热门根本不需多说,但是对于程序员群体,如果对深度学习的理解还停留在阿尔法狗战胜人类围棋高手,酷炫无人机无人驾驶这些振奋人心的新闻,或者是理解一堆深奥的数学公式和数学论证上,你可能离真正的深度学习有点远。

深度学习不仅仅是一个人人热捧的“高大上“的概念,每天撸代码的程序员其实是离他最近的一群人;如何将机器学习、实时数据处理、服务器和客户端开发有机结合在一起,而不是片面地了解其中一个部分,通过深度学习拓宽视野并将理论快速落地到实际工作中的研发,这才是程序员与深度学习最直接最真实的关联点。

好剑拿来舞,不是束之高阁仅供瞻仰。国内其实已经有企业开始真正应用深度学习技术用在业务发展中;比如美团点评这两年在深度学习方面进行了一些探索。

摘选举例 1:深度学习用来做跟美团业务特点相关的语义匹配。比如说用户状态,一个在北京和另一个在武汉的用户,在百度或淘宝上搜索任何一个词条,得到的结果不会差太多;但是在美团这样与地理位置强相关的场景下就会完全不一样。比如在武汉搜“黄鹤楼”,用户找的可能是景点门票,而在北京搜索“黄鹤楼”,用户找的很可能是一家饭店。这样就需要结合语言层信息和用户意图、状态来做语义匹配;

摘选举例 2:在美团点评上 App 上的广告首图宣传时,如果传统的图像质量排序方法主要从美学角度进行质量评价,通过颜色统计、主体分布、构图等来分析图片的美感。但在实际业务场景中,用户对图片质量优劣的判断主观性很强,难以形成统一的评价标准。如何选择首图才能更好地吸引用户呢?图像质量排序算法目标就是做到自动选择更优质的首图,以吸引用户点击。

如何将深度学习真正应用到开发和具体业务,需要扎实,深入,系统地学习深度学习的应用;StuQ 推出 60 课时(长达 40 小时)《深度神经网络实战——从 0 到 1 构建深度学习、海量数据实时分析系统》大课,在 3-4 个月学习周期内集中系统学习深度学习的思想方法和编码应用;20 小时讲方法,20 小时讲编程,一半听一半编程,真正将机器学习、实时数据处理、服务器和客户端开发有机结合在一起,帮助学员既可了解机器学习,夯实基础,又能将机器学习充分应用到实际开发中,实现技能进阶。

课程简介
  • 开班时间:2017 年 7 月 1 日

  • 上课周期:10 周共 60 课时(1 课时 =40 分钟)

  • 上课时间:暂定每周二 & 周六 20:30-22:30

  • 学习形式:直播视频讲解 + QQ 学员群交流答疑

课程大纲
模块 1:深度学习的思想与方法

掌握规律和本质才会事半功倍,真正的授之以渔!

一、基础篇(8 小时)

1、机器学习基础

  • 机器学习简介

  • 机器学习的主要任务

  • 基本算法介绍

2、常用软件集合和环境配置

  • 为什么选择用 Python

  • Python

  • NumPy

  • sckit-learn

3、数据分组和关联分析算法

  • 通过 Python 实现 K-means 算法

  • 通过 Python 实现 Apriori 算法

  • 通过 Python 实现 FP-growth 算法

4、分类器

  • 决策树(包含实战优化方法)

  • K- 邻近算法(KNN)

  • 支持向量机(SVM)

  • 贝叶斯网络

    朴素贝叶斯算法

    贝叶斯网络

二、神经网络篇(3 小时)

1、神经网络

  • 神经网络简介

  • 正向传播算法

  • 矢量化编程

神经网络向量化(有实际写代码部分内容)

2、稀疏自编码器

  • 稀疏自编码器简介

  • 反向传播算法

  • 自编码算法与稀疏性

  • 训练结果可视化

  • 实践

3、数据预处理

  • 主成分分析(PCA)

  • 白化

  • 实践

4、Softmax 回归

  • Softmax 回归

  • 实践

5、 自我学习

三、深度学习篇(3 小时)

1、深度网络简介

  • 简介

  • 深度网络优势

  • 训练的困难

  • 逐层贪婪训练方法

2、自编码算法(AE)

  • 栈式自编码算法

  • 微调多层自编码算法

3、大型图片处理

  • 线性解码器

  • 全联通与部分联通网络

  • 卷积(Convolution)

  • 池化(Pooling)

  • 卷积神经网络(CNN)

四、C++ 编程篇(6 小时)

1、C++11 与 C++14

  • 基于 Socket 的通信

  • C++ 中的内存与资源管理

  • 编码

  • C++ 98 的编码缺陷

  • C++ 14 编码支持(包含实战)

  • 进程间通信

2、高性能 C++ 服务器编程 基础 - 高效的内存管理和数据调度

  • 轻量级分身——线程

  • C++14 线程

  • 竞争问题与解决方案

  • 多线程优化

  • 异步 I/O

  • 内存分配与内存碎片

  • tcmalloc

  • 内存池

3、高性能 C++ 服务器编程 进阶 - 如何充分利用 CPU 和 GPU

  • OpenMP

  • OpenBLAS

  • OpenCL

  • CUDA

模块 2:深度学习的编程实战模块

20 小时代码实战演练,上手做比听再多都有用

五、编程实战篇(20 小时)

1、云端服务器架构设计

2、通信系统设计

3、通过 Caffe 实现深度神经网络

  • 为什么是 Caffe?

  • 准备 Caffe 依赖

  • 编译 Caffe(Linux 和 macOS)

  • 使用 Caffe 训练手写数字识别

  • 使用 Caffe 训练 AutoEncoder

  • 调用 Caffe 使用训练后的模型

4、通过 Hurricane 实时处理系统实现分布式网络拓扑

  • 实现 Spout:获取数据

  • 实现 Bolt:预处理

  • 实现 Bolt:调用 Caffe

5、实战:基于循环神经网络的图片全分辨率压缩

  • 再看 AutoEncoder

  • 利用 AutoEncoder 实现图像压缩

  • RNN(循环神经网络)介绍

  • 利用 RNN 优化图像压缩

  • 实践:编写收集训练数据的高性能分布式爬虫

  • 实践:整理训练数据集

  • 实践:在 Caffe 中实现 RNN

  • 实践:训练与测试

  • 实践:压缩接口设计与封装

  • 实践:Web 服务器搭建

  • 实践:计算服务搭建

  • 实践:完成深度学习服务

6、 基于 macOS 开发的云服务客户端

送你价值 200 元 本课程优惠码【FCXTG3BGYX】,仅限使用 10 次

了解课程详情请咨询人工小助手

抢座点 「 阅读原文 」