检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]沈阳航空工业学院电子信息工程学院,沈阳110136 [2]沈阳航空工业学院自然语言处理实验室,沈阳110136
出 处:《计算机应用》2010年第6期1671-1672,1693,共3页journal of Computer Applications
摘 要:为了提高词义排歧的准确率,提出了一种基于改进的向量空间模型(VSM)的词义排歧策略,该模型在提取特征向量的基础上,考虑了语法、词形、语义等因素,计算语境相似度,并引入搭配约束,改进了算法的效果,在开放测试环境下,词义标注正确率可达到80%以上。实验结果表明,该方法对语境信息的描述更加全面,有利于进一步的语义分析。To increase the word disambiguation accuracy,a word disambiguation solution based on improved Vector Space Model (VSM) was presented.Since the algorithm takes account of grammar,morphology and semantic and calculates the context similarity requiring the character vector abstraction,the algorithm is able to achieve better results by using collocation constraint.The open test precision can reach 80%.The result shows that the method can fully describe the features of context,and is beneficial to further semantic parsing.
关 键 词:向量空间模型 词义排歧 语境相似度 特征向量 词语搭配
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117