说到享受春天,还有什么能比阅读免费的机器学习和数据科学电子书更好的方式呢?是不是?
这是一份快速整理出的书单,可以祝您顺利地踏上学习之路。该书单从统计学基础开始,进阶至机器学习基础,然后扩展到几个更大的话题,先是对高级话题进行快速概览,最后再对全部内容加以总结。书单中既有经典话题,也有当代的前沿话题,希望你能在其中找到感兴趣的话题。
1.《统计思考:面向程序员的概率和统计》 (Think Stats: Probability and Statistics for Programmers)
http://www.greenteapress.com/thinkstats/
作者:Allen B. Downey
本书是对面向Python程序员的概率和统计的介绍。
本书重点讨论了可以用来探索真实数据集并回答有趣问题的简单技术。该书使用美国国立卫生研究院(NIH)的数据提供案例研究。鼓励读者从事具有真实数据集的项目。
2.《面向黑客的概率编程和贝叶斯方法》 (Probabilistic Programming & Bayesian Methods for Hackers)
http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/
作者:Cam Davidson-Pilon
一本从计算/理解第一,数学第二的视角,对贝叶斯方法和概率编程的介绍性著作。
贝叶斯方法是推理的自然方法,但是对读者而言,该方法隐藏在漫长繁杂的数学分析步骤之后。一般关于贝叶斯推理的典型教材要花二到三章的篇幅讲概率论,然后才进入贝叶斯推理。遗憾的是,由于大多数贝叶斯模型的在数学上难以处理,所以一般只对读者给出简单、人造的例子。这可以让用户对贝叶斯推理有一种“不过如此”的感觉。实际上,笔者以前就是如此。
3.《理解机器学习:从理论到算法》( Understanding Machine Learning: From Theory to Algorithms)
http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/
作者:Shai Shalev-Shwartz,Shai Ben-David
机器学习是计算机科学发展最快的领域之一,诞生了广泛的应用。本教科书的目的是以简明的方式介绍机器学习及其提供的算法范例。本书介绍了机器学习基础知识,以及将这些原理转化为实际算法的数学推导的理论论述过程。在介绍了基础知识后,本书涵盖了以前教科书无法解决的广泛的中心课题。其中包括对学习的计算复杂性的讨论,凸度和稳定性的概念,重要的算法范例,包括随机梯度下降、神经网络和结构输出学习等。此外还讨论了如PAC-Bayes方法和压缩边界等新兴的理论概念。
4.《统计学习的要素》(The Elements of Statistical Learning)
http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf
作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman
这本书在共同的概念框架下描述了统计学习领域内的重要思想。虽然这种方法是统计学的,但书中重点强调了概念,而不是数学。书中给出了大量例子,使用了丰富的彩图。本书对于科学界或产业界中对数据挖掘感兴趣的统计人员来说都是宝贵的资源。这本书的内容涵盖广泛,从监督学习(预测)到非监督学习。书中讨论的题目包括神经网络、支持向量机、分类树和boosting ,这是的第一本全面涵盖该内容的书。
原文链接:
http://mp.weixin.qq.com/s/feNjEt-QYbSeBVsKr3mnFg