基于多要素的中文语句相似度算法

Algorithm of Chinese Sentence Similarity based on Multifactor

作　　者：曾小芹 Zeng Xiaoqin(Department of Information and Science,Yuzhang Normal University,Nanchang Jiangxi 330103,China)

机构地区：[1]豫章师范学院信息科学系,江西南昌330103

出　　处：《信息与电脑》2017年第21期51-52,共2页Information & Computer

摘　　要：为了更精准地在海量信息中检索目标,笔者在前人研究基础上提出了一种中文语句相似度的层次递进算法。中文语句相似度综合考虑了无序相似度及有序相似度两个因素:无序相似度通过中文语句切词后得到具有相同或相近词义的词语比例;有序相似度则是计算语句各成分位置词相似度。其中,还考虑了句型转换因素及语句语气参数的修正,如此层层递进得到中文语句的相似度。最后通过实验对比验证其合理性。The author puts forward a multilevel algorithm of Chinese sentence similarity on the basic of predecessors'research.The algorithm considers disordered similarity and ordered similarity.Disordered similarity is obtained by computing the ratio of synonyms after Chinese segmentation.Ordered similarity is got by calculating the corresponding similarity of component location words.Meanwhile,the sentence pattern conversion is also considered,and if it be a Chinese question,sentence mood parameter need to be used to modify the result.Finally the algorithm rationality is verified by contrast experiment.

关键词：语句相似度有序相似度无序相似度

分类号：TP391.1[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于多要素的中文语句相似度算法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于多要素的中文语句相似度算法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索