蒙古语固定短语识别算法的设计与实现  被引量:3

Design and Implementation of Mongolian Fixed Phrase Recognition Algorithm

在线阅读下载全文

作  者:斯.劳格劳 

机构地区:[1]内蒙古大学蒙古学学院,内蒙古呼和浩特010021

出  处:《中文信息学报》2017年第5期85-91,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金(61662050);国家自然科学基金(61262046);国家社科基金(10CYY022);内蒙古大学高层次人才引进项目

摘  要:固定短语的自动识别和标注是进行蒙古语文本处理的基础和前提条件。词类标注、短语标注、句法分析、语义分类及语义角色标注等基础研究和机器翻译、文本校对等应用系统的开发均以正确标注固定短语的文本为处理对象。该文在"蒙古语固定短语语法信息词典"的基础上采用基于有限状态自动机和规则的方法设计实现了固定短语识别和标注算法。经实验,其识别率已达到90%以上,在处理中,词均用时与基于字符串匹配的算法相比提高较多,达到0.005 0ms。Automatic identification and annotation of fixed phrases are esseential to the Mongolian text processing.On the basis of"Mongolian Fixed Phrase Grammatical Information Dictionary",this paper designs and implements an algorithm for Mongolian fixed phrase recognition and labeling based on finite state automata and rules.Experiments reavel an recognition rate of more than 90%,and an average processing speed of 0.005 millisecond per word.

关 键 词:蒙古语 固定短语识别 有限状态自动机 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象