检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院,江苏南京210007 [2]解放军理工大学训练部,江苏南京210007 [3]东南大学计算机科学与工程系,江苏南京210096
出 处:《解放军理工大学学报(自然科学版)》2005年第1期30-35,共6页Journal of PLA University of Science and Technology(Natural Science Edition)
基 金:国家自然科学基金资助项目 (60 3 0 3 0 2 4)
摘 要:语义标注所用标签数目众多 ,训练数据更为稀疏 ,用 HMM作语义标注面临参数估计不准的难题。不同于传统的解决数据稀疏方法 ,以《同义词词林》的层次式结构为依据 ,提出了利用语义层次的提升来改善HMM( hidden Markov model)中参数的估计质量 ;在算法实现中 ,采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题。测试表明 ,在训练数据相对稀疏的情况下 ,适度调整模型的语义层次可大幅提高语义标注的精度 。It is difficult for hidden Markov models to get precise parameter estimation when applied to semantic tagging as the number of semantic tags is large and training data is insufficient. Different from classic method for solving data sparsity problem, a method which takes advantage of the hierarchical structure of Synonymy Thesaurus was presented to improve the quality of HMM parameter estimation by semantic induction. Restrictive selection policy was used to reverse the decline of model discriminability caused by the method. Tests indicate that the method is feasible to semantic tagging and tuning according to training data with size can greatly improve semantic tagging.
关 键 词:语义标注 隐马尔可夫模型 层次结构 自然语言处理
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229