检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王成平[1]
机构地区:[1]西南民族大学民族语言文字信息处理实验中心,四川成都610041
出 处:《湘潭大学自然科学学报》2012年第3期107-113,共7页Natural Science Journal of Xiangtan University
基 金:中央高校基本科研业务费专项资金项目09SZYZJ04);国家社科基金项目(06XYY021;07BYY060);归国留学人员创新基金资助项目(09SLX03)
摘 要:实现彝语文自动分词是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.论文以彝语言的特点作为出发点,首先提出了计算机彝文分词规则与分词词表的设计思路,其次提出了实现计算机彝文自动分词技术的算法基础、系统结构,以及实现流程,而且进行了抽样测试,其分词的速度和准确率都比较高.论文最后根据彝语言的特点对实现计算机彝文自动分词的难点进行了分析.The automatic word segmentation is an indispensable basic work of Yi language information processing. As long as Yi language information processing related to the retrieval, translation, syntactic a- nalysis , semantic analysis,it requires the use of word as basic unit. On this basis according to characteris- tics of Yi language,the automatic word segmentation standard and design of word vocabulary are described. The technology of automatic word segmentation is proposed, which based on established vocabulary of Yi language. The technology includes algorithm selection, system architecture,and implementation process. And sample tests are given, the accuracy rate and speed of word segmentation are quite satisfactory. Finally, on characteristics of Yi language and the difficulty of achieve automatic word segmentation is analyzed.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249