一种文本文档相似性计算的方法被引量：2

An Approach of Text Document Similarity Computation

出　　处：《吉林师范大学学报（自然科学版）》2014年第4期130-132,共3页Journal of Jilin Normal University:Natural Science Edition

基　　金：安徽财经大学科研项目(ACKY1452)

摘　　要：首先对当前文本文档相似度计算方法的优缺点及适用范围进行了分析.由于越长的词语表达的意思一般越完整,基于这一思想,对不同长度的词语赋予不同的权值,把长度为n的公共序列引入到相似度的计算中,构造了一文本相似度计算公式,对其中相似度计算公式的合理性给予了理论证明.最后,通过实验证明该方法是有效的.Firstly the merits and setbacks,application scopes and problems of existing methods were analyzed. Normally the longer the term,the more integrated it expressed. Based on this thought,the different weights were given to different long terms. Common sequence with length of n was introduced into the similarity computation and an equation was constructed about text similarity computation. Then the equation was theoretically proved to be reasonable. Finally the experiment results showed the method was validity.

关键词：文本文档公共序列相似度字符串匹配

分类号：TP311[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种文本文档相似性计算的方法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种文本文档相似性计算的方法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种文本文档相似性计算的方法被引量：2