最大熵算法在汉语拼音标注中的研究与实现  被引量:1

The Research and Implementation of Maximum Entropy Algorithm in Phonetic Annotation

在线阅读下载全文

作  者:张丽青[1] 寿永熙[1] 马志强[1] 

机构地区:[1]内蒙古工业大学信息工程学院,内蒙古自治区呼和浩特010080

出  处:《微电子学与计算机》2012年第8期120-122,126,共4页Microelectronics & Computer

基  金:内蒙古工业大学科学研究项目(ZD201118)

摘  要:经过对最大熵模型的研究,找到一种适合汉语拼音标注的最大熵模型算法.利用该算法解决了多音字单字成词的情况,从而使得所有包含多音字的词都是两字或多字词.使用该算法随机抽取"读者文摘"中的一篇文章进行标注实验,实验表明拼音标注正确率达到了96.6%以上.Through maximum entropy model study, a algorithm for maximum entropy model that is for pinyinmarked must be founded. Using the algorithm put an end to the situation that polyphone word is considered to be a word, so that all words with multiple pronunciations are two or more words. Using the algorithm mark the article in Reader's Digest, the results show that pinyin marked rate has reached 96.6 percent or more.

关 键 词:最大熵模型 多音字 拼音标注 统计 特征 分词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象