基于分类及最佳匹配读音的维吾尔多音词消歧  被引量:1

Uyghur Homograph Disambiguation Based on Classification and Optimal Mapping Pronunciation

在线阅读下载全文

作  者:姑丽加玛丽.麦麦提艾力 艾斯卡尔.肉孜 古丽娜尔.艾力 艾斯卡尔.艾木都拉[1] 

机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046 [2]新疆大学数学与系统科学学院,乌鲁木齐830046

出  处:《计算机工程》2012年第18期22-25,共4页Computer Engineering

基  金:国家自然科学基金资助项目(61065005,61062008);教育部新世纪优秀人才支持计划基金资助项目(NCET-10-0969)

摘  要:研究维吾尔语中的多音词现象,根据多音词的不同特点进行分类。利用词性和读音的映射关系消歧第1类多音词。根据词缀连接词干后是否发生元音弱化的特点消歧第2类多音词。提取上下文语境信息,使用最佳匹配读音的方法消歧第3类多音词。采用似然比方法进行关键词选择,并对不同窗口宽度的关键词选取方法进行对比实验。结果表明,该方法可以得到错误率为20.9%的多音词消歧效果。This paper deeply investigates the homograph in Uyghur language and classifies them according to the different features of homograph,disambiguates the first type of homograph according to the mapping relation between the part of speech and pronunciation,disambiguates the second type of homograph according to vowel weakening when suffix attaches to a stem,and optimal pronunciation mapping method is used to disambiguate the third type of homograph by extracting the contextual features of homograph.Log-likelihood ratio is used to select and keyword selection experiment of different window size is also conducted.Experimental result shows that the homograph disambiguation performance of can be got to 20.9% error rate through the research idea of this paper.

关 键 词:维吾尔语 多音词消歧 分类 元音弱化 最佳匹配读音 关键词选取 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象