WordNet中的综合概念语义相似度计算方法  被引量:25

Semantic Similarity Calculation Method of Comprehensive Concept in WordNet

在线阅读下载全文

作  者:王桐[1] 王磊[1] 吴吉义[2] 徐贺[3] 

机构地区:[1]哈尔滨工程大学信息与通信工程学院,哈尔滨150001 [2]杭州师范大学电子商务与信息安全重点实验室,杭州310027 [3]哈尔滨工程大学机电工程学院,哈尔滨150001

出  处:《北京邮电大学学报》2013年第2期98-101,106,共5页Journal of Beijing University of Posts and Telecommunications

基  金:国家自然科学基金项目(61102105;60775060);国家博士后科学基金项目(20080440840);教育部博士点基金项目(20102304120014;20102304110006);黑龙江省自然科学基金项目(F201029);浙江省自然科学基金项目(LQ12G02016;LZ12F02005)

摘  要:作为语义异构问题的基础,概念间语义相似度计算已成为研究热点,对此,提出一种基于WordNet的综合概念语义相似度计算方法.该方法不仅集成了传统的基于语义距离的算法和基于信息内容的算法,而且引入了深度、密度因子和语义重合度来进行综合分析,并针对综合算法中权值难以确定的问题,引入主成分分析改进权值分配方法.实验结果表明,改进后的方法计算的相似度与人工判断的相似度相关性较高,有效改善了概念语义相似度计算的准确性.As the basis of the semantic heterogeneity, the calculation of semantic similarity between con- cepts has become a hot topic. A calculation method based on the comprehensive concept of the semantic similarity of WordNet is presented. The method integrates traditional semantic distance-based algorithm, content-based algorithm, introduces the depth, density factor and semantic coincidence degree to conduct a comprehensive analysis. In order to determine the right weights in the synthesis algorithm, a principal component analysis is proposed to improve the weight allocation. Experiments show that the similarity of the proposed method has good correlation with similarity to the artificial one, thus the accuracy of the concept of semantic similarity calculation is improved effectively.

关 键 词:概念语义相似度 WORDNET 主成分分析 

分 类 号:TN929.53[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象