自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据
图书信息
书名:自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据作者:王侃
包装:平装
开本:16
出版社:西安电子科技大学出版社
出版时间:2021-04-01
图书简介
自然语言处理(Natural Language Processing,NLP),是计算机科学、人工智能、语言学和神经科学交叉的领域,目的是使计算机能够处理、理解、解释人类语言。本书系统地介绍了基于机器学习和深度学习对文本数据进行挖掘和分析的方法。首先,从数据收集和提取入手,详细讲解了如何从网页、PDF、Word、HTML、JSON中收集数据。接下来,介绍了文本数据处理的重要步骤,包括形式转换、删除标点符号、拼写校正、词干提取、词形还原等。第三章介绍文本特征工程,重点介绍One Hot编码、统计向量化、N-grams、哈希向量化、共生矩阵等技术的使用方法。第四章进一步介绍高级自然语言处理,包括文本相似度计算、词性标注、实体提取、主题提取、情感分析等内容。第五章介绍了自然语言处理的行业应用,如多类分类、文本数据总结、文档聚类、自然语言处理在搜索引擎中的应用等;这些技术在电子商务、金融、医疗、法律等领域得到了广泛应用。最后一章则介绍了基于深度学习的自然语言处理,包括信息检索、文本分类和单词预测等。本书注重理论与实践相结合,在理论讲解的基础上,通过大量Python代码示例,帮助读者快速学习并实现其自然语言处理技术。这本书不仅适合自然语言处理或机器学习的相关从业人员以及爱好者学习,同时也是Python程序员技术参考书,也可为相关专业的本科生和研究生提供学习参考。
推荐理由
推荐理由:如果你想学习自然语言处理技术,那么这本书会是你的理想选择。本书不仅覆盖了自然语言处理的基础知识,而且详细地介绍了如何使用Python实现自然语言处理技术。本书提供的Python示例代码可以帮助你更好地理解理论知识。此外,本书还介绍了自然语言处理的行业应用,对于需要将自然语言处理技术应用到实际工作中的读者来说,这将是一个很好的参考。总之,本书既适合自然语言处理的初学者,又适合已有一定知识储备的从业人员。