好书推荐网 收藏本站
当前位置: 好书推荐 > 自动化技术 > 详情

Spark快速数据处理 计算机与互联网 |225330

更新时间: 2024年10月07日 访问量: 2457次
图书分类 : 自动化技术
Spark快速数据处理 计算机与互联网 |225330

图书信息

书名:Spark快速数据处理 计算机与互联网 |225330
作者:美 Holden Karau
出版社:机械工业出版社
出版时间:2014-4

图书简介

Spark是一个优秀的开源通用的并行分布式计算框架。本书从实用角度系统全面地讲解了Spark的使用方法、数据处理工具及其用途。包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行优秀个Spark作业,如何在Spark集群上构建一个生产级的脱机独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),以及对Spark内置的操作和物品的详细介绍等等。本书通过手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序,同时涵盖了各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持。适合大数据、数据分析等领域从业人员。

推荐理由

本书详细介绍了如何使用Spark并提供了一些实例,使读者从入门到实际运用能够一步步地掌握这种大数据技术。本书涉及面广,讲解深入,能够很好地满足初学者和高级使用者的需求。本书主要以实用为出发点,帮助读者系统掌握困难的Spark并行处理,降低了读者的门槛,讲解深入浅出,适合各种读者在自己的领域中的使用。

美 Holden Karau的书,美 Holden Karau作品集