Spark权威指南
图书信息
书名:Spark权威指南作者:Bill,Chambers,Matei,Zaharia
包装:平装
开本:16
页数:552页
全文字数:657000
出版社:中国电力出版社
出版时间:2020-4-1
图书简介
《Spark权威指南》是一本关于Apache Spark开源集群计算框架的权威书籍,由Spark的创始人所撰写,旨在教授读者如何使用、部署和维护Apache Spark。本书将Spark功能分解为若干独立主题来进行全面介绍。第1章和第2章介绍大数据技术和Spark概述,包括Spark的架构和安装等内容。第3章至第7章介绍Spark的核心API,包括RDD(弹性分布式数据集)、DataFrame、SQL和Dataset等。读者将会学习如何使用这些API进行数据操作和管理。同时,本书也涵盖了Spark低级API的实现过程,包括RDD、SQL和DataFrame的执行过程。第8章至第10章介绍了Spark的集群运行、调试、监控和调优。通过阅读本章,读者将能够深入了解Spark集群运行的原理和方法,以及在集群环境下进行调试和监控的技巧。第11章介绍了Spark的结构化流处理,包括如何使用Spark的结构化流处理API构建端到端流数据应用。最后一章讲述了Spark的机器学习库Mllib,它提供了可扩展的机器学习算法库,读者将学习到如何使用Mllib实现分类、推荐和其他多种实际问题的解决技术。在全书的编写中,作者均注重实例和示例的使用,以更好地帮助读者理解和掌握Spark。
推荐理由
《Spark权威指南》是一本全面介绍Apache Spark开源集群计算框架的著作,由Spark的创始人所撰写。本书涵盖了Spark基本操作、常用函数、流处理引擎和可扩展机器学习库Mllib等方面的内容,可以帮助读者了解如何使用、部署和维护Spark,并掌握Spark的监控、调优和调试的原则和技巧。 如果你正在学习大数据技术或者想要深入了解Spark集群计算框架,本书将是你的良师益友。