检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:付鹏斌 陈帅帅 杨惠荣 李建君 FU Peng-bin;CHEN Shuai-shuai;YANG Hui-rong;LI Jian-jun(Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China)
机构地区:[1]北京工业大学信息学部
出 处:《计算机技术与发展》2020年第1期13-18,共6页Computer Technology and Development
基 金:北京市自然科学基金资助项目(4153058)
摘 要:设计了一种基于依存关系与同义词词林相结合的语义相似度计算方法。该方法通过依存关系分别提取两个文本的关系路径,同时基于同义词词林计算两个文本之间关系路径的语义相似度。在计算两个文本之间的语义相似度时,使用语言技术平台(language technology platform,LTP)对文本进行中文分词以及获取文本的依存关系图,从中提取关系路径,从而可以结合关系路径和同义词词林计算两个文本之间的语义相似度。通过实验,获得的平均偏差率为13.83%。实验结果表明,结合依存关系与同义词词林的语义相似度方法在准确率上相比较基于同义词词林的语义相似度和基于依存关系的语义相似度有了一定的提高。We present a method of calculating semantic similarity based on the combination of dependency relation and Tongyici Cilin.This method extracts the relationship paths of two texts by the dependency relation,and calculates the semantic similarity of the relationship paths between two texts based on Tongyici Cilin.When calculating the semantic similarity between two texts,we use language technology platform(LTP)to segment the Chinese text and obtain the dependency graph of the text,and extract the relationship path from it,so that we can calculate the semantic similarity between the two texts by combining the relationship path and Tongyici Cilin.The average deviation rate is 13.83%in the experiment which shows that the accuracy of the semantic similarity method based on the dependency relation and Tongyici Cilin is better than that based on Tongyici Cilin and based on the dependency relation.
关 键 词:依存关系 同义词词林 语义相似度 关系路径 平均偏差率
分 类 号:TP1816[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49