Scala和Spark大数据分析 函数式编程、数据流和机器学习
图书信息
书名:Scala和Spark大数据分析 函数式编程、数据流和机器学习作者:雷扎尔·卡里姆(Md.,Rezaul,Karim),斯里达尔·阿拉,Sridhar Alla,史跃东
包装:平装
开本:16
页数:624页
全文字数:996000
出版社:清华大学出版社
出版时间:2020-6
图书简介
《Scala和Spark大数据分析》是一本全面、系统的介绍Scala和Spark应用开发的面向对象和函数式编程概念的技术书籍。本书覆盖了SparkSQL、结构流、graphX和SparkMLib等所有API,指导读者用Scala编写强大的Spark程序。此外,本书还涵盖了大量的实用案例,紧贴实践场景。本书适合想利用Scala和Spark执行数据分析的人士,对大数据分析问题有着很高的实际应用价值。
推荐理由
近年来,Scala和Spark在数据科学和分析领域势头更盛。基于Scala的Spark被广泛应用于生产环境,海量数据的分析可瞬间完成。《Scala和Spark大数据分析》为读者提供了深入理解Scala的面向对象和函数式编程概念、深入学习RDD和数据帧等Spark核心概念,并使用SparkSQL和GraphX分析结构化与非结构化数据,最后还讲解使用Spark执行大规模数据分析。此书是一本十分有用的大块头书籍,它呈现概念,并透彻地讲述如何实现概念。读者可以不仅学习从简单的批处理、流处理到机器学习的处理方式,同时将函数式编程和面向对象概念融为一体的精妙Scala类型系统。因此,若想从事数据科学和分析领域以及大数据的数据分析处理,推荐使用《Scala和Spark大数据分析》这本书。