检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘呈龙[1] 贾胜颖[1] 张丽萍[1] 刘东升[1]
机构地区:[1]内蒙古师范大学计算机与信息工程学院,内蒙古呼和浩特010022
出 处:《计算机工程与设计》2012年第4期1660-1664,共5页Computer Engineering and Design
基 金:国家自然科学基金项目(60940027);内蒙古自然科学基金项目(2010MS0906)
摘 要:为了检测程序设计类课程中出现的作业抄袭行为,提出了基于抽象语法树的抄袭检测方法。运用语法分析工具对代码进行语法分析生成抽象语法树(AST),通过计算生物学中序列匹配的算法进行程序相似度的计算。提取程序相似部分的AST特征,生成空间向量,聚类分析找出"抄袭团伙"。实验结果表明,该方法对抄袭行为具有较好的检测效果,并能比较准确地找到"抄袭团伙"。To detect plagiarism on programming course, a AST-based plagiarism detection method is proposed. Firstly, the code is parsed by syntax analysis tool to generate the corresponding abstract syntax tree (AST). Biology sequence matching algo rithms are used to calculate the similarity of the program. The similar part of the code is found, and then the AST feature is ex tracted in this part. A vector space model is generated, and then "copy cluster" is found by clustered the feature. Experiments show that this method has a good effect on the detection of plagiarism and can find the "copy cluster" accurate.
关 键 词:抄袭检测 抽象语法树 序列匹配 空间向量模型 聚类
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.132.49