Spark海量数据处理 技术详解与平台实战(异步图书出品)
图书信息
书名:Spark海量数据处理 技术详解与平台实战(异步图书出品)作者:范东来
包装:平装
开本:16
出版社:人民邮电出版社
出版时间:2019-12-01
图书简介
在大数据时代,ApacheSpark作为分布式计算框架,已成为大数据处理的标杆。本书基于Spark2.4.4,分为三部分,包含大量实例和完整项目示例。优秀部分介绍BDAS框架、Spark编程、SparkSQL等基础内容,同时探讨了高级主题,如StructuredStreaming、Spark机器学习、Spark深度学习等。第二部分详细实现了企业背景调查系统,借鉴了数据湖与Lambda架构思想,涵盖了批处理、流处理应用,并加入多种开源组件。第三部分是全书总结和展望。本书层次分明、循序渐进,适合准备学习和应用Spark的人员阅读和参考。
推荐理由
在数字经济时代,数据是重要的资源要素,如何高效地处理海量数据是现代企业的一大挑战。本书全面介绍了大数据处理框架Spark的理论基础与实际应用,包含大量的实例和完整项目示例,可供读者从基础到高级进行学习和实践。适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。