检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:斯.劳格劳
机构地区:[1]内蒙古大学蒙古学学院,内蒙古呼和浩特010021
出 处:《中文信息学报》2017年第5期85-91,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金(61662050);国家自然科学基金(61262046);国家社科基金(10CYY022);内蒙古大学高层次人才引进项目
摘 要:固定短语的自动识别和标注是进行蒙古语文本处理的基础和前提条件。词类标注、短语标注、句法分析、语义分类及语义角色标注等基础研究和机器翻译、文本校对等应用系统的开发均以正确标注固定短语的文本为处理对象。该文在"蒙古语固定短语语法信息词典"的基础上采用基于有限状态自动机和规则的方法设计实现了固定短语识别和标注算法。经实验,其识别率已达到90%以上,在处理中,词均用时与基于字符串匹配的算法相比提高较多,达到0.005 0ms。Automatic identification and annotation of fixed phrases are esseential to the Mongolian text processing.On the basis of"Mongolian Fixed Phrase Grammatical Information Dictionary",this paper designs and implements an algorithm for Mongolian fixed phrase recognition and labeling based on finite state automata and rules.Experiments reavel an recognition rate of more than 90%,and an average processing speed of 0.005 millisecond per word.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.151