检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工程大学信息与通信工程学院,哈尔滨150001 [2]杭州师范大学电子商务与信息安全重点实验室,杭州310027 [3]哈尔滨工程大学机电工程学院,哈尔滨150001
出 处:《北京邮电大学学报》2013年第2期98-101,106,共5页Journal of Beijing University of Posts and Telecommunications
基 金:国家自然科学基金项目(61102105;60775060);国家博士后科学基金项目(20080440840);教育部博士点基金项目(20102304120014;20102304110006);黑龙江省自然科学基金项目(F201029);浙江省自然科学基金项目(LQ12G02016;LZ12F02005)
摘 要:作为语义异构问题的基础,概念间语义相似度计算已成为研究热点,对此,提出一种基于WordNet的综合概念语义相似度计算方法.该方法不仅集成了传统的基于语义距离的算法和基于信息内容的算法,而且引入了深度、密度因子和语义重合度来进行综合分析,并针对综合算法中权值难以确定的问题,引入主成分分析改进权值分配方法.实验结果表明,改进后的方法计算的相似度与人工判断的相似度相关性较高,有效改善了概念语义相似度计算的准确性.As the basis of the semantic heterogeneity, the calculation of semantic similarity between con- cepts has become a hot topic. A calculation method based on the comprehensive concept of the semantic similarity of WordNet is presented. The method integrates traditional semantic distance-based algorithm, content-based algorithm, introduces the depth, density factor and semantic coincidence degree to conduct a comprehensive analysis. In order to determine the right weights in the synthesis algorithm, a principal component analysis is proposed to improve the weight allocation. Experiments show that the similarity of the proposed method has good correlation with similarity to the artificial one, thus the accuracy of the concept of semantic similarity calculation is improved effectively.
分 类 号:TN929.53[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.189.143