文本数据挖掘与Python应用(大数据与人工智能技术丛书)
图书信息
书名:文本数据挖掘与Python应用(大数据与人工智能技术丛书)作者:刘金岭,钱升华
包装:平装
开本:16
全文字数:279000
出版社:清华大学出版社
出版时间:2021-02-01
图书简介
本教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验。第1章介绍文本挖掘产生的背景、概念、模型表示、预处理,以及文本分类与聚类的评价方法。第2章讲述文本数据采集,语料库与词典简介,以及基于Python jieba分词模块的分词、文本特征词选择。第3章着重讲解文本预处理,向量空间模型、概率模型及其Python实现,概率主题模型。第4章介绍文本分类的概念、流程、预处理,以及常用的KNN、SVM、Rocchio、朴素贝叶斯、决策树分类器,并讲解分类模型的性能评估。第5章详细介绍文本聚类的概念、流程,以及基于划分、层次、密度、网格和模型的方法,包括对聚类算法的性能要求和评估方法。第6章讲解关联规则挖掘的概念和分类,以及Apriori和FP-Growth算法。最后,第7章通过Python进行文本数据的简单应用,包括情感分析、生成关键词和摘要、商品评价、生成词云等方面。
推荐理由
《文本数据挖掘与Python应用》不仅涵盖了文本挖掘的基本理论与算法,更是将Python作为工具进行相关试验,介绍文本分类、文本聚类、信息抽取等应用,在实践中让读者初步掌握数据挖掘的方法和技巧。此书适用于计算机相关专业的学生和从事自然语言处理、数据挖掘方面的专业人士。