中文短文本语法语义相似度算法  被引量:14

A Chinese Short Text Similarity Algorithm Based on Semantic and Syntax

在线阅读下载全文

作  者:廖志芳[1] 周国恩[1] 李俊锋[2] 刘飞[1] 蔡飞[1] 

机构地区:[1]中南大学软件学院,湖南长沙410075 [2]中南大学信息科学与工程学院,湖南长沙410075

出  处:《湖南大学学报(自然科学版)》2016年第2期135-140,共6页Journal of Hunan University:Natural Sciences

基  金:国家自然科学基金青年基金资助项目(61202095);湖南省自然科学基金资助项目(12JJ3074)~~

摘  要:通过分析中文短文本的特征,提出了一种基于语法语义的短文本相似度算法.该算法结合中文语句语义的相似性以及语句语法的相似性,即计算具有相同句法结构的短文本的相似度以及考虑语句词组顺序对相似度的贡献,对中文短文本相似度进行计算.实验表明,本文提出的算法在中文短文本相似度计算结果上更加接近人们的主观判断并且拥有比较好的精确率与召回率.A short text algorithm based on semantic and syntax by analyzing the characteristics of Chinese short text was proposed. The algorithm combines semantic similarity with the similarity of sentence syntax in Chinese short text, that is to say, to calculate the similarity of short text with the same syntax structure and consider the contribution with sentence words order to similarity. The experiments show that the proposed algorithm is closer to people's judgment and gets a better precision rate and recall rate in the aspect of Chinese short text similarity calculation results.

关 键 词:语法语义相似度 语句相似性计算 HOWNET 语料库 语法分析 语义分析 相似度计算 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象