Kettle构建Hadoop ETL系统实践(大数据技术丛书)
图书信息
书名:Kettle构建Hadoop ETL系统实践(大数据技术丛书)作者:王雪迎
包装:平装
开本:16
全文字数:559000
出版社:清华大学出版社
出版时间:2021-07-01
图书简介
《Kettle构建HadoopETL系统实践》是一本介绍Kettle在Hadoop数据仓库中ETL过程的实践指南。全书分10章,详细讲解了ETL与Kettle的基本概念、Kettle的安装与配置、Kettle对Hadoop的支持、建立ETL示例模型、数据抽取、数据转换与装载、定期自动执行ETL作业、维度表技术、事实表技术,并行、集群与分区技术。本书通过销售订单示例演示如何实现,配合Linux操作系统虚拟机进行讲解,易懂且实用。适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,同时也适合希望学习Kettle的高等院校和培训机构人工智能与大数据相关专业师生参考。
推荐理由
本书介绍了一款易用性好、编码工作量小、功能完备的ETL工具——Kettle,以及如何在Hadoop数据仓库上实现ETL过程。本书内容实用且易懂,通过销售订单实例展示了Kettle在Hadoop平台中的应用,对于大数据技术人员和学习Kettle的师生均具有一定的指导和实践意义。