传递信息分类的句子间相似性度量  

Sentence similarity measurement based on information category it contains

在线阅读下载全文

作  者:李林[1] 周一民[1] 

机构地区:[1]北京航空航天大学计算机学院,北京100191

出  处:《计算机工程与应用》2009年第31期15-17,共3页Computer Engineering and Applications

基  金:国家重点基础研究发展规划(973)No.2007CB310803~~

摘  要:提出了一种计算英文句子间相似度的方法。基于句子所传递的信息——其描述的对象、描述对象的属性和动作,首先将待比较的两个句子进行语块分析,并从中提取以上三个方面的信息;然后通过语义向量的方法,分别计算两个句子在这三个方面的相似度;最后将它们结合起来作为两个句子的整体相似度,并通过训练得到最优的结合参数。实验表明,提出的方法与目前计算句子间相似度的方法相比更加符合人工判断句子间相似度的过程,表现出更高的准确性,达到了较高的性能指标。A method is proposed to determine English sentence similarities.Based on the information a sentence delivers:objects, properties and actions,the two compared sentences are chunked and further the above information is extracted.Then the similarities between objects,properties,and actions from the two sentences are calculated based on a semantic vector method. Finally the overall sentence similarity is defined as a combination of these three similarities by a parameter training method. Experiments show that the proposed method makes the sentence similarity comparison similar to the people's comprehension to the meanings of the sentences and also achieves a better performance with a high accuracy.

关 键 词:句子相似度 词汇语义相似度 语块分析 语义向量 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象