专栏名称: Python爱好者社区
人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。
目录
相关文章推荐
Python爱好者社区  ·  炸裂!华为AI「打卡营」上线 ·  昨天  
Python爱好者社区  ·  开源!Transformers 快速入门书 ·  2 天前  
Python爱好者社区  ·  两天私活,3w到手 ·  3 天前  
Python爱好者社区  ·  最近招了个浑身软肋的优质员工:房贷150万, ... ·  5 天前  
Python爱好者社区  ·  python速成手册 ·  6 天前  
51好读  ›  专栏  ›  Python爱好者社区

数据分析师的必读书单

Python爱好者社区  · 公众号  · Python  · 2017-08-09 17:06

正文

点击上方图片查看配套视频教程

作者:秦路,天善智能特约专家。资深数据分析师,数据化运营专家。擅长结合运营和数据,建立数据化运营体系。

个人公众号:秦路(微信ID:tracykanc)


有不少人留言希望我推荐数据分析的书单,刚好即将春节,无论是假日学习还是年后,都值得充电。读书最好的时候是学生时期,其次是现在。内容按照 《如何七周成为数据分析师 》 的顺序。

数据分析是一门专业且跨越多个领域的学科,虽然我每篇公众号都足够篇幅(乃至我自己觉得啰嗦),可我还是得承认存在缺漏。如果有好书作为参考,对数据分析能力的成长更有帮助。

这份书单权作入门级推荐,如果大家有更好的欢迎留言说明。我不能保证全部看过,毕竟基础书没必要看几本,但我尽量做到客观。建议大家根据自己基础挑选,不要贪多。

大家多支持正版。

Excel

《谁说菜鸟不会数据分析》


知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。

是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。

这里只推荐一本,因为我就翻过上面这本,还没全看…

数据可视化

数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。


内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。

可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。

英文足够好,可以看Edward Tufte的著作:《The Visual Display of Quantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。

分析思维

《金字塔原理》



分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。

另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。

《深入浅出数据分析》



深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。

《精益数据分析》



国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。

接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。

SQL

数据库有很多种,常见有Oracle,MySQL,SQL Server等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。

MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。

《MySQL必知必会》



如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。

如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。

如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。

统计学

统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。

《深入浅出统计学》



大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。

《商务与经济统计》



国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。

名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。

《The Elements of Statistical Learning》



稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。

以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。

业务知识

不同领域的业务知识都不一样,这里以互联网举例。

《增长黑客》


增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。

实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。

《从零开始做运营》



知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。

《网站分析实战》



互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营。

《数据挖掘与数据化运营实战》



这本书涉及了数据挖掘,但是比较浅,可以作为数据分析师视野的承上启下,了解数据化运营的高级应用。特点是以阿里的实际工作相结合,可又因为保密原则不够详尽。

《数据实践之美》


是各领域专家众筹完成的书本,比起传统的书籍,囊括范围更广。虽然没有深度讲解技术,但是各领域的案例都是一手资料,对业务的触类旁通理解有帮助。

业务知识我不再多推荐,以后我会通过公众号文章的形式讲解。因为从我看来,市面上也没有详尽介绍数据角度下的用户行为、产品运营的书籍,都是点到为止。这一块内容,尽量从工作中去学,收获才是最大的。

Python/R

欢迎来到数据分析的最后殿堂,Python和R都是大分支,基本是前面所有内容的实现。Python的学习以PY3为前提,毕竟2017年了,我实在想不出不用Python3的理由。

除了书籍,Python/R更多依靠博客和文档学习。Python的学习路径不陡峭,新手水平取决于查询能力,所以也请学会如何高效搜索。

《深入浅出Python》


还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然,这是本书缺点:能掌握,但是Bug比较多。

《Python学习手册》



对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。这是纸质书比电子书好的优势之一。

《利用Python进行数据分析》


非新手向的书籍,成书较早,部分内容比较老旧。虽然学习中不会有问题,但很多Pandas函数已经有更优雅的写法了,例如df.query。每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。

《Python Cookbook》


Python的进阶书,如果想要掌握更好的编程能力,这是一本经典,值得时时翻阅。注意,它更偏向程序员。

《R语言实战》



R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。

《统计学:从数据到结论》


这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。缺点是书本后面的内容质量不如前部分。

到这里,入门书籍推荐完毕,当然好书不嫌多,例如《数学之美》、《集体智慧编程》、《统计学习方法》等,有兴趣不妨阅读。

上面的内容都吃透,不论是成为一名数据分析师,还是往后向机器学习、数据科学家、数据产品发展、都有了良好的基础。

希望你能沉下心阅读。

如果你都看完,或者已经不必要看,可以向我要下一阶段的书籍

想了解更多干货就使劲戳戳戳~~~

天善智能年度数据分析扛鼎之作,秦路主讲,七周成为数据分析师课程。
人气讲师,期盼已久,潜心打造,不负众望!
涵盖基础、业务、思维、工具、方法等方面皆具,提纲挈领!
给自己一段七周之旅,奠定基石基础,踏上数据分析师之路!

点击阅读原文或扫码咨询