大数据Spark企业级实战
图书信息
书名:大数据Spark企业级实战作者:王家林
包装:平装
开本:16
出版社:电子工业出版社
出版时间:2015-01-01
图书简介
Spark是当今大数据领域最活跃、最热门、高效的大数据通用计算平台。在“OneStacktorulethemall“理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、MachineLearning、GraphProcessing等大数据计算模型统一到一个技术堆栈中。本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,详细解析了企业级Spark开发所需的几乎所有技术内容,源码解析Spark集群的动手构建,Spark的架构设计,Spark内核的解析,SparkSQL,MLLib,GraphX,SparkStreaming,Tachyon,SparkR,Spark多语言编程,Spark常见问题及调优等,学习完此书即可胜任绝大多数的企业级Spark开发需要。
推荐理由
大数据处理是未来的趋势,而Spark作为目前最流行的处理平台之一,难免会成为大数据处理中心的计算平台。《大数据Spark企业级实战》详细介绍了如何从零开始掌握Spark大数据处理实战技术,从企业处理大数据业务场景的角度出发,为读者提供了大量实战代码和源码解析,让读者彻底掌握Spark的架构设计、集群搭建、内核解析、调优等内容,使其能够胜任绝大多数的企业级Spark开发需求。如果你对大数据处理领域感兴趣,那么这本书绝对值得一读。