敏捷数据科学:用Hadoop创建数据分析应用(博文视点出品)
图书信息
书名:敏捷数据科学:用Hadoop创建数据分析应用(博文视点出品)作者:Russell Jurney,冯文中,朱洪波
包装:平装
开本:16
页数:184页
出版社:电子工业出版社
出版时间:2014-7
图书简介
对大数据的挖掘需要投入大量的人力和时间。怎么才能确保构建的是一个正确的模型?《敏捷数据科学:用Hadoop创建数据分析应用》提供了一套灵活的工具和方法论。本书以一个真实的电子邮箱数据挖掘为例,讲解了一整套实用工具及其方法论,可快速实现在Hadoop上构建数据分析应用的过程。作者使用Python、Apache Pig和D3.js等轻量级工具创建用于探索数据的敏捷环境,并演示了一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。本书所有的代码样例都可以在Heroku中以App形式运行,方便读者实践。
推荐理由
本书介绍的是Hadoop上构建数据分析应用的工具和方法论,对于学习大数据分析的初学者和进阶者都是不可多得的实践指南。作者教授了敏捷开发的思想和方法,让团队能够快速适应数据分析的需求。书中以一个真实的电子邮箱数据挖掘为例,让读者深入理解如何用敏捷方法构建数据分析应用,而且作者演示的方法都使用轻量级工具,不需要大量的人力和时间,因此非常适合中小企业和创业公司使用。我强烈推荐这本书给每个想学习大数据分析的人。