好书推荐网 收藏本站
当前位置: 好书推荐 > 数据库 > 详情

数据清洗基础与实践

更新时间: 2024年09月30日 访问量: 936次
图书分类 : 数据库
数据清洗基础与实践

图书信息

书名:数据清洗基础与实践
作者:谢东亮,黄天春
包装:平装
开本:16
出版社:西安电子科技大学出版社
出版时间:2019-09-01

图书简介

数据清洗是大数据开发的基础环节,也是重要的环节之一。数据清洗就是发现并纠正数据源中存在的错误,对错误值、异常值、缺失值等可疑数据按照一定的规则和方法,使用必要的工具进行清洗与整理,使其变得干净,达到可以进行数据分析的目的。本书分为两篇,共九章,系统地讲解了数据清洗的理论与实践。优秀篇为基础篇,其中优秀章介绍数据清洗的基本概念、数据标准化以及数据仓库的概念等;第二章介绍数据格式类型与数据编码,从文件以及文本的格式、文档的归档与压缩、字符编码与数据转换方面做了介绍;第三章对常用的文本与电子表格数据清洗做了介,第四章介绍了数据清洗的基本技术、方法与工具;第五章从文本、Web文件、数据库数据的抽取方面做了介绍;第六章介绍了数据的转换与加载和数据的质量评估。第二篇为实战篇,其中第七章介绍了五种常用的数据清洗工具;第八章专门讲解了如何对Web的数据进行采集及预处理;第九章介绍了从RDBMS数据源中获取数据及进行数据的脱敏、清洗等操作。读者可通过本书深入地了解数据清洗的相关知识,掌握数据清洗的基本方法,同时结合实际案例更好地理解数据清洗技术的具体应用与实践。

推荐理由

本书系统地讲解了数据清洗的理论与实践,可作为大数据课程教材或数据清洗的读物。详细讲解数据清洗的基本概念、技术、方法与工具、数据抽取、转换、加载、质量评估等方面。对于想要学习数据清洗的读者,本书是一本不可多得的好书。

谢东亮的书,谢东亮作品集