在大数据火爆的今天,市面上各种网上学习资料以及书籍铺天盖地,下面为大家推荐几本大数据技术方面的书籍:
这本书被戏称为大象书,包含了Hadoop核心的MapReduce、YARN和HDFS,及Hadoop生态圈中常用的HBase、Hive等技术,初学者可以通过此书对Hadoop生态有一个较为全面的认识。
虽然YARN是资源管理器,但是很多数据处理框架都用它来管理资源。想要深入了解YARN的同学们可以参考一下这本书。话说这本权威指南真的很权威,因为作者就是YARN的创建和开发团队。
这本书也算是Spark最经典的入门书了,把Spark的基本概念和各个方面介绍的比较全面。缺点就是Spark发展比较快,所以这本书有点老了(2015年10月出版),有一小部分东西跟当前版本不太对应的上。
这本书适合有一些Spark基础的同学(比如读完上一本书之后再读),主要介绍了利用Spark进行数据分析和机器学习。缺点和上一本一样,就是也有点老了。
这是一本专门介绍Spark的图计算库Spark
GraphX的书。优点是比较新(2017年3月出版),应该可以紧跟当前版本。缺点也是比较新,还没有太多人看过,所以不好评价。想尝鲜的不妨试试。
网络大数据
(ID:raincent_com)
网络大数据 www.raincent.com
由清华CDN实验室于2011年创办,
致力于打造中国最专业的网络大数据科学门户网站。
识别二维码,关注网络大数据