Hadoop生态系统
图书信息
书名:Hadoop生态系统作者:Kevin Sitto,凯文·斯托,Marshall Presser,马歇尔·普瑞斯
包装:平装
开本:16
页数:109页
全文字数:123000
出版社:中国电力出版社
出版时间:2016-11-1
图书简介
《Hadoop生态系统》本书每一章都介绍了不同的主题,解释了为什么特定组件适用或不适用特定的需求。总结了Hadoop生态系统的多个组件,方便读者了解不同的组件之间的区别和作用,从而更好地选择自己需要的组件进行开发。
对于Hadoop的数据处理来说,使用Hadoop是一个全新的挑战。但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
1. 核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
2. 数据库和数据管理,Cassandra、HBase、MongoDB和Hive。
3. 序列化,Avro、JSON和Parquet。
4. 管理和监视,Puppet、Chef、Zookeeper和Oozie。
5. 分析辅助,Pig、Mahout和MLLib。
6. 数据传输,Scoop、Flume、distcp和Storm。
7. 安全、访问控制和审计,Sentry、Kerberos和Knox。
8. 云计算和虚拟化,Serengeti、Docker和Whirr。
推荐理由
本书详尽地介绍了Hadoop生态系统的多个组件,帮助读者了解不同组件的作用和区别,同时还给出了如何选择合适的Hadoop组件的建议,是Hadoop入门学习的好书。