数据清洗/大数据应用人才培养系列教材
图书信息
书名:数据清洗/大数据应用人才培养系列教材作者:刘鹏,张燕,李法平,陈潇潇
包装:平装
开本:16
页数:238页
全文字数:280000
出版社:清华大学出版社
出版时间:2018-6-1
图书简介
数据清洗在大数据领域中扮演重要的角色。本书共分为8章,包括数据清洗的概念、任务和流程,数据标准化、ETL概念和技术路线,Excel、Kettle、OpenRefine、DataWrangler、Hawk等常用清洗工具的使用,数据抽取的各种方法,数据清洗的步骤、数据检验、处理等,网页结构和网络爬虫技术的应用,以及RDBMS的数据清洗方法和数据脱敏处理技术。该书应用广泛,适用于高职高专院校和应用型本科的大数据课程教学,也适用于希望了解及掌握数据清洗的专业人员。
推荐理由
《数据清洗:大数据应用人才培养系列教材》通过系统地讲解数据清洗理论和实际应用,能帮助读者了解数据清洗在大数据处理中的重要作用,掌握数据清洗的方法和步骤。本书内容丰富,结构清晰,语言简洁明了,适合大数据领域的初学者和专业人员使用。