我不管我就是要放音乐↑
「互联网上半场的野蛮增长以跑马圈地为主要手段,到了如今下半场则需要依托数据驱动的精细化运营。」这是我在近期历次公开分享中始终谈及的变化趋势。
在数据科学家成为炙手可热职位的当下,如何修炼呢?最近,我所签约的
电子工业出版社
发布了一系列以数据分析为主题的新书,拿到试读后在此给大家做一发推荐。各位可以根据自己的实际水平选择购买。
一、《数据天才:数据科学家修炼之道》
官方介绍:
这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。
《数据天才:数据科学家修炼之道》有 3 个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。《数据天才:数据科学家修炼之道》中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写 API),所以借助《数据天才:数据科学家修炼之道》,你现在就可以开始数据科学实践,并快速地提升你的职业水平。
《数据天才:数据科学家修炼之道》是写给数据科学家和相关专业人士的(如业务分析师、计算机科学家、软件工程师、数据工程师和统计学家),也适合有兴趣转投大数据科学事业的人阅读。
XDash 评价:
这本书 50% 是数据科学家的职业生涯入门指导,剩下 50% 是代码技术层面的提纲挈领式的提点,适合有一定数据知识背景的朋友作为从业向导。
买家秀时间:
二、《全栈数据之门》
官方介绍:
《全栈数据之门》以数据分析领域最热的 Python 语言为主要线索,介绍了数据分析库 numpy、Pandas 与机器学习库 scikit-learn,使用了可视化环境 Orange 3 来理解算法的一些细节。对于机器学习,既有常用算法 kNN 与 Kmeans 的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。在大数据 Hadoop 与 Hive 环境的基础之上,使用 Spark 的 ML/MLlib 库集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。
《全栈数据之门》不是从入门到精通地介绍某一种技术,可以把《全栈数据之门》当成一本技术文集,内容定位于数据科学的全栈基础入门,全部内容来自当前业界最实用的技能,有非常基础的,也有比较深入的,有些甚至需要深入领悟才能理解。
《全栈数据之门》适用于任何想在数据领域有所作为的人,包括学生、爱好者、在职人员与科研工作者。无论想从事数据分析、数据工程、数据挖掘或者机器学习,或许都能在书中找到一些之前没有接触过的内容。
XDash 评价:
偏重实操的「器」层面的一本书,从 Linux 基本操作到 Python 安装到 Numpy 和 Hadoop、MySQL 实用,一直延伸到机器学习和深度学习的知识图谱,很实用的技能快查手册,适合常置案头。
买家秀时间:
三、《Excel数据处理与分析实战宝典》
官方介绍:
随着数据时代的来临,Excel 的数据处理与分析能力对职场人士而言是必备的一项职业技能,数据处理与分析能力也正在成为组织的核心竞争力。《Excel 数据处理与分析实战宝典》并没有对 Excel 的各个功能进行全面介绍,而是侧重于 Excel 数据处理与分析在实际工作中的应用,旨在帮助职场中的Excel 用户和有一定 Excel 基础的希望进阶的读者。《Excel 数据处理与分析实战宝典》精选了众多的技巧和经典案例,并辅以深入浅出的解析,力求让更多希望深入掌握 Excel 数据处理与分析技巧的读者取得长足的进步。
《Excel 数据处理与分析实战宝典》从实际工作应用出发,重点介绍了数据处理的重要技巧及函数的应用,特别是数据清理技术的应用能让读者对数据去伪存真,掌握数据主动权,全面掌控数据;Excel 中 SQL、数据透视表、Power Query、Power Pivot、VBA 的应用重在挖掘隐藏的数据价值,轻松整合海量数据;各种图表类型的制作技巧及 PowerView 的应用可展现数据可视化效果,让数据说话。