专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
目录
相关文章推荐
杭州本地宝  ·  手慢无!杭州3月普通话测试即将开始报名! ·  昨天  
余杭时报  ·  不合格!涉及多款沐浴液、洗发水! ·  3 天前  
余杭发布  ·  余杭这个村,生孩子就发钱! ·  3 天前  
51好读  ›  专栏  ›  AI数据派

独家|免费!数据科学及机器学习必备书单下载!(理论&应用)

AI数据派  · 公众号  ·  · 2019-03-19 07:30

正文

作者:Trung Nguyen

翻译:王雨桐

校对:张一豪

本文 1000字 ,建议阅读 5分钟

本文将分理论部分和实际部分为你推荐一些机器学习和数据科学的相关书籍。

公众号主界面回复 ‘14’ 获取本 文推荐书籍下载链接


理论部分


以下都是机器学习的基础教材。如果你认真研读其中任意一本,这意味着你要分析其中的模型,推导和实现主推理算法并进行练习,这些教材可以为你提供坚实的背景。如果你是机器学习的入门菜鸟,这些书可能技术性很强,但是一旦你坚持完成其中一本,你会发现其他教材也变得简单易懂。

1. 统计学习精要(The Elements of Statistical Learning (ESL))



作者: Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie

推荐语: 经典之作!!这同时也是一个在线课程,新版教材提供R代码

2. 模式识别与机器学习(Pattern recognition and machine learning (PRML))



作者: Christopher Bishop

推荐语: 和ESL一样,这本也是必读之作。

3. 机器学习:概率学观点(Machine Learning: A Probabilistic Perspective)



作者: Kevin R Murphy

推荐语: 如果你彻底学习(前文)PRML,你能掌握这本书中的大部分内容。 然而,这是一本有趣而全面的书,主要关注有原则的、概率性的建模方法。 它还附带Matlab中的代码。

4. 概率图模型(Probabilistic Graphical Models)



作者: Daphne Koller and Nir Friedman

推荐语: 图模型为概率模型的表示、推理以及学习提供了框架。这个强大的框架为许多机器学习模型提供了宏观视角,否则这些模型仅仅被看作一堆不同的模型。书还配有Coursera的在线课程。


5. 强化学习(Reinforcement learning, an introduction)



作者: Richard S. Sutto and Andrew G. Barto

推荐语: 尽管这本书还是一个初稿,但第二个版本已经写得很好,并且很好地解释了强化学习的概念和应用。

6. 神经网络与深度学习(Neural networks and deep learning)



作者: Michael Nielsen

推荐语: Michael Nielsen的书更加实用,包含一些很酷的互动内容以帮助理解


7. 深度学习(Deep Learning)



作者: Ian Goodfellow and Yoshua Bengio and Aaron Courville

推荐语: 相比上面Michael Nielsen书的实用性,本书则更全面。我建议按照给定的顺序阅读学习。

应用部分


1. 商业中的数据科学(Data science for business)



作者: Foster Provost and Tom Fawcett

推荐语: 本书对非技术人员(如业务经理)非常友好。它还提供了有关如何执行数据科学项目的一些合理原则。强烈推荐此书!!

2. R数据科学(R for data science)



作者: Garrett Grolemund and Hadley Wickham

推荐语: 特别是对R用户来说,这本是必读教材。

3. 应用预测建模(Applied predictive modelling)



作者: Kjell Johnson and Max Kuhn

推荐语: 由非常流行的R包caret的作者撰写,也是一本必读教材。 它包含许多实用技巧和建议,不仅可用于建模,还可用于不同模型的数据准备。

4. 数据科学技术:市场营销、销售与客户关系管理领域(Mining Techniques: For Marketing, Sales, and Customer Relationship)



作者: Gordon S. Linoff and Michael J. A. Berry

推荐语: 不要被标题误导,书中的数据科学技术普遍适用,不仅仅是对客户关系管理(CRM)。

5. 数据挖掘的数据准备(Data preparation for data mining)



作者: Dorian Pyle

推荐语: 1999年出版,但今天仍然非常适用,本书提供了一个明细的清单,以便在准备分析数据时进行检查。

6. 网站优化的Bandit 算法(Bandit algorithms for website optimization)



作者: John Myles White

推荐语: 本书介绍了标准的多臂赌博机算法(multi-armed bandit),并提供了多种语言的实现。

7. R数据科学实战手册(Practical data science with R)



作者: John Mount and Nina Zumel

推荐语: 此书不像Johnson和Kuhn的书那样精致,但还是有一些值得了解的技巧。







请到「今天看啥」查看全文