一种基于WordNet的混合式语义相似度计算方法  被引量:7

A WordNet-based hybrid semantic similarity measurement

在线阅读下载全文

作  者:张思琪[1] 邢薇薇[1] 蔡圆媛[1] 

机构地区:[1]北京交通大学软件学院,北京100044

出  处:《计算机工程与科学》2017年第5期971-977,共7页Computer Engineering & Science

基  金:国家自然科学基金(61272353;61370128;61428201);教育部新世纪人才计划(NCET-13-0659);北京高校青年英才计划(YETP0583)

摘  要:语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。Calculation of semantic similarity is an important research content of natural language pro- cessing (NLP), and many measurements have been proposed for the past few decades. These measure- ments have been widely used in word sense disambiguation, text clustering and other research fields. We propose a new measurement to calculate information content (IC) with WordNet ontology, and then propose two new hybrid measurements to calculate semantic similarity. Experimental results show that the proposed method is better than the existing methods for considering both the shortest path distance and the IC semantic distance simultaneously , and the results are more close to human judgment.

关 键 词:WORDNET 语义相似度 信息量 本体 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象