基于局部词频指纹的论文抄袭检测算法  被引量:10

Plagiarism-detection Algorithm for Scientific Papers Based on Local Word-frequency Fingerprint

在线阅读下载全文

作  者:秦玉平[1] 冷强奎[1] 王秀坤[2] 王春立[3] 

机构地区:[1]渤海大学信息科学与工程学院,辽宁锦州121000 [2]大连理工大学电子与信息工程学院,辽宁大连116024 [3]大连海事大学信息科学技术学院,辽宁大连116026

出  处:《计算机工程》2011年第6期193-194,197,共3页Computer Engineering

基  金:国家自然科学基金资助项目(60603023);国家"973"计划基金资助项目(2001CCA00700)

摘  要:提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程度上克服了现有论文抄袭检测算法检测精度低的缺点,具有较快的检测速度。An algorithm for plagiarism-detection of scientific papers based on local word-frequency fingerprint is presented.Sentence is regarded as the basic component elements of a document,and extracting efficient keywors,sorting and reconstructing them.According to the code and word-frequency,the fingerprints are get to compute text similarity degree.The identification experiments on SOGOU-T database are done with the algorithm.Experimental results show that it partly overcomes the shortage of existing plagiarism-detection of scientific papers,and it has better performance on identification precision and identification speed.

关 键 词:抄袭检测 数字指纹 局部词频 相似度 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象