面向大数据的高效能垃圾文本分类
图书信息
书名:面向大数据的高效能垃圾文本分类作者:刘伍颖
包装:平装
开本:32
出版社:国防工业出版社
出版时间:2014-10-01
图书简介
《面向大数据的高效能垃圾文本分类》是一本全面分析大数据时代垃圾信息特性的重要著作。本书分为七章,其中优秀章阐述了大数据和垃圾信息的概念以及大数据时代垃圾信息的态势;第二章概述了垃圾信息过滤方法,包括基于协议和内容的过滤方法以及性能评价方法;第三章着重研究了信息文档的文本统计特性,包括结构特性和Token频率分布的幂律特性;第四章提出了多域学习的思想,研究了面向垃圾信息过滤的多域学习文本分类;第五章提出了基于Token频率索引的文本分类算法,并进行了复杂度分析;第六章研究了主动学习文本分类,提出了时序优先、先验区间和基于方差的非确定采样主动学习策略;第七章设计了面向大数据的高效能垃圾文本过滤系统,包括多Cluster垃圾文本过滤系统、多语种大数据深度舆情系统、个性化垃圾邮件过滤系统。该书内容丰富,适用于大数据计算技术相关专业高年级本科生、研究生以及网络信息技术公司高级研究人员参考。
推荐理由
本书涵盖了垃圾信息过滤的各个方面,不仅有理论分析,还有大量实验,具有一定的实用性。本书不仅能够提高读者的计算能力,还能够帮助读者理解大数据时代的垃圾信息特性,提出合理的解决方案。