一种基于知网的句子相似度计算方法  被引量:27

A Method of Sentence Similarity Computing Based on Hownet

在线阅读下载全文

作  者:程传鹏[1] 吴志刚[1] 

机构地区:[1]中原工学院计算机学院,河南郑州450007

出  处:《计算机工程与科学》2012年第2期172-175,共4页Computer Engineering & Science

基  金:河南省教育厅自然科学资助项目(2008B520046)

摘  要:句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一种改进的句子相似度计算方法。依据知网对"实体概念"的描述,构造出义原的语义层次树,由各个义原在树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。Sentence similarity is the basis of document similarity,and sentence similarity computing plays an important role in the field of natural language processing.The current methods of sentence similarity computing neglect the influence of sentence structure.On the basis of the interrelated research,this paper proposes an improved method of similarity comparison.The semantic tree of sememe is constructed according to the description of entity conception in the Hownet,the semantic similarity of sememe is computed based on the relative positions in the sememe tree.Calculating of sentence similarity is based on surface similarity and semantic similarity.Under the same test conditions,the experiments show that the proposed method is much closer to the people's comprehension to the meanings of the sentences.

关 键 词:句子相似度 知网 表层相似度 语义偏移量 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象