基于语义提升HMM的语义标注  被引量:3

Semantic tagging using HMM with semantic induction

在线阅读下载全文

作  者:李向阳[1] 张亚非[2] 陆建江[3] 

机构地区:[1]解放军理工大学通信工程学院,江苏南京210007 [2]解放军理工大学训练部,江苏南京210007 [3]东南大学计算机科学与工程系,江苏南京210096

出  处:《解放军理工大学学报(自然科学版)》2005年第1期30-35,共6页Journal of PLA University of Science and Technology(Natural Science Edition)

基  金:国家自然科学基金资助项目 (60 3 0 3 0 2 4)

摘  要:语义标注所用标签数目众多 ,训练数据更为稀疏 ,用 HMM作语义标注面临参数估计不准的难题。不同于传统的解决数据稀疏方法 ,以《同义词词林》的层次式结构为依据 ,提出了利用语义层次的提升来改善HMM( hidden Markov model)中参数的估计质量 ;在算法实现中 ,采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题。测试表明 ,在训练数据相对稀疏的情况下 ,适度调整模型的语义层次可大幅提高语义标注的精度 。It is difficult for hidden Markov models to get precise parameter estimation when applied to semantic tagging as the number of semantic tags is large and training data is insufficient. Different from classic method for solving data sparsity problem, a method which takes advantage of the hierarchical structure of Synonymy Thesaurus was presented to improve the quality of HMM parameter estimation by semantic induction. Restrictive selection policy was used to reverse the decline of model discriminability caused by the method. Tests indicate that the method is feasible to semantic tagging and tuning according to training data with size can greatly improve semantic tagging.

关 键 词:语义标注 隐马尔可夫模型 层次结构 自然语言处理 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象