基于句子相似度的文档复制检测算法研究  被引量:9

Research on the Copy Detection Based on the Similarity of Sentences

在线阅读下载全文

作  者:秦新国[1] 

机构地区:[1]南京审计学院教务处,南京210029

出  处:《现代图书情报技术》2007年第11期63-66,共4页New Technology of Library and Information Service

摘  要:提出一种基于句子相似度的文档复制检测技术,在抓住文档的全局特征的同时又兼顾文档的结构信息,克服以往检测算法两者不可兼顾的缺陷,提高检测精度。最后,给出该算法与其他算法检测结果的比较情况。实验证明,该算法是可行的。In the paper, a new document copy detection algorithm based on the similarity of the sentences is proposed. In order to improve the detection accuracy, the authors not only emphasize on the whole document, but also on the structure of the document. In the end, experiments and comparison are taken between the new algorithm and other typical algorithms, the result shows that it is feasible.

关 键 词:文档复制检测 句子相似度 指纹 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象