专栏名称: Python程序员

最专业的Python社区，有每日推送，免费电子书，真人辅导，资源下载，各类工具。我已委托“维权骑士”（rightknights.com）为我的文章进行维权行动

每月好书：深入浅出深度学习：原理剖析与Python实践

Python程序员 · 公众号 · Python · 2017-06-07 08:27

正文

和老规矩一样，本月月考的奖品就是《深入浅出深度学习》两本。不知道什么是月考的同学，请补习下面文章：

每月送书活动来袭,免费哦!

规则就说到这里，下面是书籍介绍。

-----------割------------

深入浅出深度学习：原理剖析与Python实践

（通俗易懂讲解深度学习核心要素，快速炼成AI工程师！杨强教授、邓侃博士力荐！入门+工具+思维+实践=深度学习速成宝典！）
黄安埠著 ISBN 978-7-121-31270-0
2017年6月出版定价：79.00元
344页 16开

编辑推荐

本书最大的特色在于取舍明确，一切无助于迅速理解深度学习精髓的内容全被摒弃了，并着重阐述了技术上的重点和难点；表达上深入浅出：即便是从未接触过AI知识的人，也能从作者简明清晰的表述中，一窥深度学习的殿堂。
对任何一位想成为AI/深度学习领域工程师的读者来说，《深入浅出深度学习：原理剖析与Python实践》能帮你迅速打开AI的大门，并成长为一名合格的AI工程师。

内容提要

《深入浅出深度学习：原理剖析与Python实践》介绍了深度学习相关的原理与应用，全书共分为三大部分，第一部分主要回顾了深度学习的发展历史，以及Theano的使用；第二部分详细讲解了与深度学习相关的基础知识，包括线性代数、概率论、概率图模型、机器学习和最优化算法；在第三部分中，针对若干核心的深度学习模型，如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解，并针对不同的模型给出相应的具体应用。

《深入浅出深度学习：原理剖析与Python实践》适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用，书中对模型的原理与难点进行了深入分析，在每一章的最后都提供了详细的参考文献，读者可以对相关的细节进行更深入的研究。最后，理论与实践相结合，《深入浅出深度学习：原理剖析与Python实践》针对常用的模型分别给出了相应的应用，读者也可以在Github中下载和查看《深入浅出深度学习：原理剖析与Python实践》的代码（https://github.com/innovation-cat/DeepLearningBook）。

第1 部分概要 1

1 绪论 2
1.1 人工智能、机器学习与深度学习的关系 3
1.1.1 人工智能——机器推理 4
1.1.2 机器学习——数据驱动的科学 5
1.1.3 深度学习——大脑的仿真 8
1.2 深度学习的发展历程 8
1.3 深度学习技术概述 10
1.3.1 从低层到高层的特征抽象 11
1.3.2 让网络变得更深 13
1.3.3 自动特征提取 14
1.4 深度学习框架 15

2 Theano 基础 19

2.1 符号变量 20
2.2 符号计算的抽象——符号计算图模型 23
2.3 函数 26
2.3.1 函数的定义 26
2.3.2 Logistic回归 27
2.3.3 函数的复制 29
2.4 条件表达式 31
2.5 循环 32
2.6 共享变量 39
2.7 配置 39
2.7.1 通过THEANO_FLAGS配置 40
2.7.2 通过. theanorc文件配置 41
2.8 常用的Debug技巧 42
2.9 小结 43

第2 部分数学与机器学习基础篇 45

3 线性代数基础 46
3.1 标量、向量、矩阵和张量 46
3.2 矩阵初等变换 47
3.3 线性相关与向量空间 48
3.4 范数 49
3.4.1 向量范数 49
3.4.2 矩阵范数 53
3.5 特殊的矩阵与向量 56
3.6 特征值分解 57
3.7 奇异值分解 58
3.8 迹运算 60
3.9 样例：主成分分析 61

4 概率统计基础 64

4.1 样本空间与随机变量 65
4.2 概率分布与分布函数 65
4.3 一维随机变量 66
4.3.1 离散型随机变量和分布律 66
4.3.2 连续型随机变量和概率密度函数 67
4.4 多维随机变量 68
4.4.1 离散型二维随机变量和联合分布律 69
4.4.2 连续型二维随机变量和联合密度函数 69
4.5 边缘分布 70
4.6 条件分布与链式法则 71
4.6.1 条件概率 71
4.6.2 链式法则 73
4.7 多维随机变量的独立性分析 73
4.7.1 边缘独立 74
4.7.2 条件独立 74
4.8 数学期望、方差、协方差 75
4.8.1 数学期望 75
4.8.2 方差 76
4.8.3 协方差 76
4.8.4 协方差矩阵 78
4.9 信息论基础 81
4.9.1 信息熵 81
4.9.2 条件熵 83
4.9.3 互信息 84
4.9.4 相对熵与交叉熵 84

5 概率图模型 87
5.1 生成模型与判别模型 89
5.2 图论基础 90
5.2.1 图的结构 90
5.2.2 子图 91
5.2.3 路径、迹、环与拓扑排序 92
5.3 贝叶斯网络 95
5.3.1 因子分解 96
5.3.2 局部马尔科夫独立性断言 99
5.3.3 I-Map与因子分解 100
5.3.4 有效迹 103
5.3.5 D-分离与全局马尔科夫独立性 108
5.4 马尔科夫网络 108
5.4.1 势函数因子与参数化表示 109
5.4.2 马尔科夫独立性 111
5.5 变量消除 114
5.6 信念传播 116
5.6.1 聚类图 116
5.6.2 团树 120
5.6.3 由变量消除构建团树 123
5.7 MCMC采样原理 126
5.7.1 随机采样 127
5.7.2 随机过程与马尔科夫链 128
5.7.3 MCMC采样 132
5.7.4 Gibbs采样 134
5.8 参数学习 137
5.8.1 最大似然估计 137
5.8.2 期望最大化算法 138
5.9 小结 140

6 机器学习基础 142
6.1 线性模型 143
6.1.1 线性回归 143
6.1.2 Logistic回归 148
6.1.3 广义的线性模型 150
6.2 支持向量机 151
6.2.1 最优间隔分类器 152
6.2.2 对偶问题 155
6.2.3 核函数 156
6.3 朴素贝叶斯 160
6.4 树模型 162
6.4.1 特征选择 163
6.4.2 剪枝策略 165
6.5 聚类 166
6.5.1 距离度量 167
6.5.2 层次聚类 168
6.5.3 K-means聚类 171
6.5.4 谱聚类 172

7 数值计算与最优化 177
7.1 无约束极小值的最优化条件 177
7.2 梯度下降 179
7.2.1 传统更新策略 181
7.2.2 动量更新策略 183
7.2.3 改进的动量更新策略 184
7.2.4 自适应梯度策略 187
7.3 共轭梯度 188
7.4 牛顿法 192
7.5 拟牛顿法 194
7.5.1 拟牛顿条件 194
7.5.2 DFP算法 195
7.5.3 BFGS算法 196
7.5.4 L-BFGS算法 197
7.6 约束最优化条件 200

第3 部分理论与应用篇 205

8 前馈神经网络 206
8.1 生物神经元结构 207
8.2 人工神经元结构 208
8.3 单层感知机 209
8.4 多层感知机 212
8.5 激活函数 217
8.5.1 激活函数的作用 217
8.5.2 常用的激活函数 219

9 反向传播与梯度消失 225
9.1 经验风险最小化 227
9.2 梯度计算 228
9.2.1 输出层梯度 228
9.2.2 隐藏层梯度 230
9.2.3 参数梯度 234
9.3 反向传播 235
9.4 深度学习训练的难点 237
9.4.1 欠拟合——梯度消失 237
9.4.2 过拟合 240

10 自编码器及其相关模型 243
10.1 自编码器 243
10.2 降噪自编码器 245
10.3 栈式自编码器 247
10.4 稀疏编码器 250
10.5 应用：cifar10图像分类 254

11 玻尔兹曼机及其相关模型 258
11.1 玻尔兹曼机 258
11.2 能量模型 261
11.2.1 能量函数 261
11.2.2 从能量函数到势函数 262
11.2.3 从势函数到概率分布 263
11.3 推断 264
11.3.1 边缘分布 265
11.3.2 条件分布 267
11.4 学习 270
11.4.1 最大似然估计 271
11.4.2 对比散度 274
11.5 应用：个性化推荐 276
11.5.1 个性化推荐概述 276
11.5.2 个性化推荐架构与算法 279
11.5.3 RBM与协同过滤 285

12 递归神经网络 291
12.1 Elman递归神经网络 292
12.2 时间反向传播 295
12.3 长短时记忆网络 299
12.4 结构递归神经网络 302
12.5 应用：语言模型 308
12.5.1 N元统计模型 308
12.5.2 基于LSTM 构建语言模型 312

13 卷积神经网络 318
13.1 卷积运算 319
13.2 网络结构 320
13.3 卷积层 324
13.4 池化层 329
13.5 应用：文本分类 333

精彩节摘

推荐序1

介绍深度学习的书籍不少，但是《深入浅出深度学习：原理剖析与Python实践》与其他同类书相比，视角明显不同。如果要给本书写个宣传语，或许可以是“深度学习工程师速成培训教材”。本书对读者的知识结构有两点要求：一是学过高等数学，二是熟悉 Python 编程。换而言之，各个专业的理工科学生，尤其是学过 Python 编程的，都是此书的目标读者。

本书内容全面，但是取舍明确，有重点地深入，尤其对于技术的重点难点解释得很详细，深入浅出。

本书最大的特色就在于内容取舍的尺度非常明确——着重于原理的解释和动手实践的路径，但是并不拘泥于细枝末节。

胸中有经纬，就不会迷失在细节的汪洋大海。本书刚好侧重于对经纬的梳理。此处的经纬，一类是数学基础知识，另一类是深度学习技术。与深度学习相关的数学知识包括线性代数、概率统计等。因为概率图与深度学习结合较多，本书把“概率图”作为单独的一章重点讲述。深度学习技术包括机器学习的传统技术、用于训练神经网络的梯度下降等算法。本书重点讲述了神经网络的基本算法以及几种常用的深度网络架构。

工程师，重在实践。工欲善其事必先利其器，实践深度学习，离不开深度学习工具。本书介绍了 Theano 工具集的基本用法。其实深度学习工具，一通百通，各种工具的区别，类似于北京口音与东北口音的区别。

认真读完此书，读者应该拥有三项能力：一是读得懂深度学习的论文；二是读得懂深度学习的代码；三是能够自行开发简单的深度学习应用。

总结一下，在深度学习技术异常火爆，深度学习工程师奇缺的当下，如何快速培养深度学习方向的工程师，是一个迫切的问题。此书是难得的好教材。

邓侃博士

推荐序2

在过去的这十年，深度学习已经席卷了整个科技界和工业界，2016年谷歌阿尔法狗打败围棋世界冠军李世石，更是使其成为备受瞩目的技术焦点。记得2010年7月我参与了Facebook人脸识别（Face Detection）工作，那时候深度学习还没有普及，这个系统是当时世界上最大的实时人脸识别系统，每天都有几千万张脸被找出来。随着硬件的成熟和数据的指数级增加，深度学习在很多问题上成为人工智能最火和最有效的方法。

这几年，我身边越来越多的计算机从业者，甚至在校大学生向我咨询，有效了解和学习这个当前人工智能最热门的领域的方法。没错，一方面深度学习很热门，人人都对此充满了好奇和向往，但是同时，它对于初学者往往挑战也不小，因为需要一定的数学基础，同时各种专业术语，如果不用深入浅出的方式讲，很容易让人产生畏难情绪。

所以我推荐黄安埠的这本《深入浅出深度学习：原理剖析与Python实践》给所有对深度学习有兴趣的朋友们，本书涵盖了深度学习的理论以及各种常见的深度学习模型，你们会在这本书中找到关于深度学习最实用的知识和信息。对于初学者来说，这是一本非常通俗易懂的入门教材。

同时我也推荐该书给深度学习领域的开发者和数据科学家，因为作者也分享和总结了许多深度学习的最佳实践法，并辅以相当多的实际应用案例加以诠释，是一本值得借鉴参考的好书。

陈尔东

前Twitter总监，前Facebook经理和早期工程师

作者简介

黄安埠，2012年毕业于清华大学，获硕士学位，在校期间活跃于TopCoder等编程竞赛社区。现为腾讯基础研究高级工程师，研究领域包括个性化推荐、自然语言处理和大规模的相似度优化计算，特别是对于深度学习在推荐系统的应用有深入的研究，并申请了国内十余项相关专利。

本书的配套代码，读者也可以在作者的Github主页中下载查看：
https://github.com/innovation-cat/DeepLearningBook)

媒体评论

杨强，香港科技大学计算机系主任，中国人工智能协会副理事长——
在这个人工智能红红火火的年代，写出一本能让初学者和“老司机”同样感到非常有用的机器学习书是一件很有意义却又不容易的事。黄安埠的《深入浅出深度学习：原理剖析与Python实践》就做到了这一点。本书从最基本的人工智能假设出发，回顾了人工智能的发展简史，很自然地把读者带入现代常用的算法、思想和实践中。从数学基础，到编程例证，再到各个流行的开源软件包，本书起到了入门与工具的作用。同时，书的后半部也帮助读者深入了解深度学习的思维和实践。

我一直在寻找一本既可以用于教学也能给学生动手做系统的工具书，现在很高兴地向大家推荐：本书就可以达到这个目的。

邓侃博士，北京大数医达科技有限公司CTO——

本书内容全面，但是取舍明确，有重点地深入，尤其对于技术的重点难点解释得很详细，深入浅出：着重于原理的解释和动手实践的路径，但是并不拘泥于细枝末节。

认真读完此书，读者应该拥有三项能力：一是读得懂深度学习的论文；二是读得懂深度学习的代码；三是能够自行开发简单的深度学习应用。

在深度学习技术异常火爆，深度学习工程师奇缺的当下，如何快速培养深度学习方向的工程师，是一个迫切的问题。此书是难得的好教材。

陈尔东，前Twitter总监，前Facebook经理和早期工程师——

本书涵盖了深度学习的理论以及各种常见的深度学习模型，读者会在这本书中找到关于深度学习最实用的知识和信息。

对于初学者来说，这是一本非常通俗易懂的入门教材；对深度学习领域的开发者和数据科学家而言，因为作者在书中分享和总结了许多深度学习的最佳实践方法，并辅以相当多的实际应用案例加以诠释，这也是一本值得借鉴参考的好书。

前言

What magical trick makes us intelligent? The trick is that there is no trick. The power of intelligence stems from our vast diversity, not from any single, perfect principle.
—— Marvin Minsky

智能（Intelligence）这个词的出现最早可以追溯到古希腊时期，当时人们已经开始梦想能创造出一种像人类一样，具有独立思考和推理能力的机器，但由于受到当时生产力水平的制约，古人对“智能”的研究更多的是停留在理论探索阶段。到了近代，尤其是具有划时代意义的达特茅斯会议的召开，标志着人工智能开始从理论探索进入到理论与应用相结合的实践阶段。从世纪年代开始，人工智能的发展大致经历了三个阶段，分别从最初的逻辑推理，到统计机器学习，再到近年来逐渐占据主流地位的深度学习。

每月好书：​ 深入浅出深度学习：原理剖析与Python实践

正文

请到「今天看啥」查看全文

每月好书：深入浅出深度学习：原理剖析与Python实践