基于语义角色标注的汉语句子相似度算法  被引量:11

Chinese Sentence Similarity Computing Based on Semantic Roles Annotation

在线阅读下载全文

作  者:田堃[1] 柯永红[1] 穗志方[1] 

机构地区:[1]北京大学信息科学技术学院,北京100871

出  处:《中文信息学报》2016年第6期126-132,共7页Journal of Chinese Information Processing

基  金:国家"973"计划(2014CB340504)

摘  要:在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。In the process of semantic roles annotation,searching for similar annotated sentences is a common way to analyze such corpus.Existing methods cannot take full advantage of verbs and related elements,so they are unable to meet the demand of searching for similar annotated sentences.This article develops a new method to calculate Chinese sentence similarity focused on the verbs.Based on semantic roles annotation,the algorithm detects the similar sentences by analyzing the semantic roles,matching the annotated sentences,and calculating similarity between these matched sentences.To get a better result,the article also compares several other methods for word similarity,including algorithms based on How-net and Distributed Representation,and applies the best one into our algorithm.The experimental result indicates that the sentence similarity algorithm based semantic roles annotation performs better than traditional methods.

关 键 词:语义角色标注 词语相似度 知网 词向量 标注句型匹配 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象