Hadoop+Spark+Python大数据处理从算法到实战
图书信息
书名:Hadoop+Spark+Python大数据处理从算法到实战作者:朱春旭
包装:平装
开本:16
页数:448页
全文字数:635000
出版社:北京大学出版社
出版时间:2021-6
图书简介
本书坚持以实例为主,理论为辅。作者从应用场景切入,围绕新基建的云计算、大数据及人工智能,介绍大数据的概念与特点及典型的产业应用场景,帮助读者了解大数据项目和机器学习开发过程,并能够设计不同场景下的项目架构,并做好不同业务下的数据建模。 紧接着,介绍了容器云、Hadoop、HBase、Hive、Spark等工具的环境搭建和开发流程,帮助读者打好基础。接下来重点讲解了机器学习算法,包括scikit-learn、SparkML和TensorFlow等工具的使用。最后,则以实战介绍了Spark机器学习库中的协同过滤算法和卷积神经网络的应用实践。
推荐理由
本书通过深入浅出的方式,让读者了解大数据的概念和技术,掌握与之相关的技术工具和算法。此书涉及的实例范围较广,是初学者入门、进阶学习的好帮手。同时,该书不仅涉及到理论知识,而且大多数章节都包含实际的应用场景,使学习更具实践性。推荐给对云计算、大数据和机器学习有兴趣的读者。