实验考试系统中的基于词频代码反剽窃技术  

A Keywords Frequency Codes Similarity Detection

在线阅读下载全文

作  者:赵靖[1] ZHAO Jing(Science College of Anhui Science and Technology University,Fengyang 233100)

机构地区:[1]安徽科技学院

出  处:《现代计算机》2019年第19期28-31,共4页Modern Computer

基  金:移动互联网新技术创客实验室(No.Xj201743)

摘  要:随着网络发展,编码在线考试系统的大量应用,有效地检测源代码克隆剽窃有着应用。代码相似度检测方法或者仅利用普通的文本短语相似检测方法,或者利用过于更为复杂低效的源代码的编译特征度量。注意到高级语言源代码的依赖保留词高度结构化特征,在OJ实践中提出一个基于保留词频率源代码相似度快速检测方法:首先通过词法分析切分统计词汇,进而产生源代码的保留词词频向量来计算相似度。通过大量在线源代码的实验结果表明有很快的检测速度和较好的检测效果,并在AOJ系统中大量使用,效果较好。Similarity detection of software code become more and more important with the rapid development of software technology and networking evolution.Traditional methods of similarity code detection neglect a simple fact that code are well-structured texted by reserve-words spliced.Considering reserve-words specialty,proposes the similarity detection methods which first convert code text to tokens sequence by lexical analysis,then compute their metrics similarity of trait reverse-words frequency.Experiments of prototype systems show that these methods are more efficient and effective.

关 键 词:源代码克隆检测 词法分析 文本特征向量模型 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象