一种改进的基于句子相似度的检测算法  被引量:1

An Improved Detection Algorithm for Document Reproduction

在线阅读下载全文

作  者:邢长征[1] 孙伟[1] 

机构地区:[1]辽宁工程技术大学电信学院,辽宁葫芦岛125105

出  处:《计算机系统应用》2010年第2期90-92,共3页Computer Systems & Applications

摘  要:基于句子相似度的文档复制检测算法在抓住了文档的全局特征的同时又兼顾文档的结构信息,在该算法的基础上对相似度算法进行了改进,解决了人工设定阈值的问题,并提高了检测精度。实验证明,该算法是可行的,并减少了响应时间。The document copy detection algorithm based on the similarity of the sentences cannot only emphasize on the whole document, but also on the structure of the document. This paper improves the similarity algorithm based on it, solves the artificial problem of threshold setting and improves the detection accuracy. The result of experiments shows that it is feasible and the running time is reduced.

关 键 词:文档复制检测 句子相似度 指纹 词频统计 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP311[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象