藏文文本自动处理方法研究
图书信息
书名:藏文文本自动处理方法研究作者:珠杰
包装:平装-胶订
开本:16
全文字数:200000
出版社:西南交通大学出版社
出版时间:2018-05-01
图书简介
藏文作为一种少数民族的语言文字,具有独特的语音、语法特征,但是由于其使用的局限性,给藏文信息处理带来了很多挑战,其中文本处理是其中重要的一个问题。《藏文文本自动处理方法研究》论述了藏文字处理、藏文词处理和藏文自动校对方法。
优秀部分以藏文字处理为研究对象,在不同的角度介绍了藏文自动处理技术的多个方面。其中,藏文排序方法展现了基于编码GB的藏文字排序规则以及排序算法。同时,研究了藏文音节规则及其应用,建立了针对藏文规则库,应用最长匹配策略进行智能处理的算法,并取得了良好的效果。此外,还论述了针对藏文拼写问题提出的自动拼写算法,在预处理和处理过程中加入了音节分析,提高了纠错的效率和准确率。
第二部分以藏文词处理为研究对象,研究了藏文停用词自动处理方法、藏文人名识别方法,其中采用了条件随机场(CRF)和深度学习的技术,提升了识别准确率。通过研究,建立了一套现实情景中有效的藏文姓名识别方法,并通过大量数据集验证了实际效果。
第三部分以藏文自动校对为研究对象,讨论了基于音节规则的藏文拼写检查算法、藏文自动校对系统框架和接续关系检查算法。利用条件语句实现了相应功能,提高了自动校对的准确率和效率。该书内容全面,结合了机器学习和自然语言处理等相关技术,能够有效提升藏文文本处理效率,适用于相关专业研究生和相关行业从业人员。
推荐理由
《藏文文本自动处理方法研究》全面阐述了藏文排序、音节规则、自动拼写、停用词识别、人名识别和自动校对等多个角度的处理方法,并成功地应用了机器学习和自然语言处理等相关技术来提高效率和精度。适用于高等院校藏文信息处理技术、计算机科学与技术、藏语言文学等相关专业研究生和从事藏文信息处理技术、藏语计算语言学、藏语言文学研究的相关人员。