好书推荐网 收藏本站
  • 图书作者:Alex Holmes
    推荐理由:该书详细讲解了Hadoop和MapReduce的基本概念,收集了85个问题及其解决方案,在关键问题领域对基础概念和实战方法做了权衡。适合使用Hadoop进行数据存储、管理和分析的技术人...
  • 图书作者:Russell Jurney
    推荐理由:本书介绍了如何用Hadoop构建数据分析应用,使用Python、Apache Pig和D3.js等轻量级工具,创建敏捷环境来探索数据,学习迭代式的开发方法,在每个迭代周期过后获取用户反馈,...
  • 图书作者:蔡斌
    推荐理由:本书从源代码的角度对“Common+HDFS”和MapReduce的架构设计与实现原理进行了极为详细的分析,并对分布式技术、分布式系统设计、Java编程技巧、编程规范和设计模式等深入总...
  • 图书作者:Tom White
    推荐理由:本书介绍如何使用Apache Hadoop构建和维护稳定性高、伸缩性强的分布式系统。本书适用于程序员分析任何大小的数据集,也适用于管理员设置和运行Hadoop集群。新版新增MapRedu...
  • 图书作者:荀亚玲
    推荐理由:本书详细介绍了数据挖掘的产生和定义,任务与分类,研究前沿和发展趋势等内容,主要讲解并行数据挖掘和性能优化的方法和技巧,并以关联规则和数据相关性分析为例进行了深入...
  • 图书作者:许利杰
    推荐理由:本书以Apache Spark框架为核心,涵盖大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。分为四部分内容,旨在帮助读者掌握大数据处理框架...
  • 图书作者:蒋守壮
    推荐理由:该书详解Apache Kylin概念、安装、配置、部署等基础知识,并介绍了多维分析的Cube算法的创建、配置与优化,对于大数据分析人员和架构师具有较高参考价值。
  • 图书作者:Benoy Antony。 Caze
    推荐理由:该书旨在帮助有经验的开发人员快速学习和使用Hadoop,在真实场景中构建大数据解决方案。该书由已认证Hadoop开发者、Committers和峰会演讲者编写,是自学Hadoop框架流程和功...
  • 图书作者:凯西·斯特拉
    推荐理由:本书是一本大数据领域的入门指南,详细介绍了大数据的基础概念、技术架构以及涉及到的相关技术,是从业人员和学生的必备参考。
  • 图书作者:Eric Sammer
    推荐理由:本书详细介绍了Hadoop的各项操作,包括设计、安装、设置等,并能帮助读者提供稳定持续的系统表现。对于希望通过学习Hadoop工作原理提高NapReduce工作效率的开发者,也必将从...
  • 图书作者:范斌
    推荐理由:Alluxio是一个快速的、可扩展的分布式虚拟文件系统,旨在将不同种类和不同存储类型的数据统一在一起。《Alluxio:大数据统一存储原理与实践》是一本全面介绍Alluxio相关技术...
  • 图书作者:王雪迎
    推荐理由:本书详细介绍了ApacheHAWQ的基础架构,功能特性和数据挖掘与机器学习方法。内容分技术解析、实战演练与数据挖掘三个部分,共27章。技术解析部分说明HAWQ的基础架构与功能特...
  • 图书作者:安俊秀
    推荐理由:本书从Hadoop的起源开始,介绍了Hadoop的安装和配置,并对Hadoop的每个组件分别进行了介绍,最后对Hadoop实时数据处理技术作了简单介绍。本书按照“模块理论—模块实践”这...
  • 图书作者:王传东
    推荐理由:本书基于Hadoop大数据平台,详细讲解大数据平台的搭建与运维、采集与存储,处理、分析和可视化,详细介绍Hadoop、MapReduce、HDFS、Hive、Spark和Zookeeper等技术的相关知识...
  • 图书作者:美 拉姆 Lam
    推荐理由:《Hadoop实战》是一本介绍Hadoop分布式架构的实践技能书籍,涵盖了Hadoop框架和生态系统。本书适合云计算程序员、架构师和项目经理参考。
  • 图书作者:顾立平
    推荐理由:入门级读物《数据馆员的Hadoop简明手册》为初级数据馆员提供了迅速了解Hadoop知识、用途及整体概貌的基础知识,包括Hadoop的历史、生态体系、核心架构、MapReduce方案、优化...
  • 图书作者:肖睿
    推荐理由:本书以Hive为开发平台,通过贯穿项目和实战项目相结合的方式进行教学,涵盖了Hive入门、数据库操作、元数据、高级操作、函数、Streaming、视图与索引、调优、HBase集成和数...
  • 图书作者:Mark
    推荐理由:本书提供了专家级指导,帮助读者使用Apache Hadoop设计端到端数据管理解决方案。书中从架构的整体角度思考,将各种组件紧密结合在一起,形成有针对性的应用程序,并提供了详...
  • 图书作者:朱凯
    推荐理由:本书针对企业级大数据平台的构建和实现进行深入的探讨,旨在解决大数据应用过程中出现的问题。
  • 图书作者:王雪迎
    推荐理由:Kettle易用性好,编码工作量小,功能完备,基于Java,允许多线程与并发执行以提高效率。本书以CDH作为Hadoop平台,结合销售订单示例,详细介绍并演示如何使用Kettle完成Had...