检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈杰 冯秀芳 陈永乐 CHEN Jie;FENG Xiu-fang;CHEN Yong-le(School of Information and Computer,Taiyuan University of Technology,Jinzhong 030600,China)
机构地区:[1]太原理工大学信息与计算机学院,山西晋中030600
出 处:《计算机工程与科学》2021年第7期1324-1330,共7页Computer Engineering & Science
基 金:山西省重点研发计划(201903D121121);虚拟现实技术与系统国家重点实验室(北京航空航天大学)开放基金(VRLAB2019A05)。
摘 要:为了在语料库中找出源代码的真实作者,提出了一种代码耦合度与程序依赖图特征结合的神经网络模型CPNN来识别源代码作者。首先,使用从源代码中提取的参数、扇入和扇出等特征计算代码的耦合度。其次,从转换的程序依赖图中提取控制和数据依赖项,应用预处理技术将PDG特征转换为具有频率细节的小实例,并且利用逆文档频率技术放大源代码中每个PDG特性的重要性。最后,利用CPNN模型预测程序员的编码风格特征,并对编码风格的真正作者进行属性划分。在1000名程序员的源代码数据集上进行作者归属预测,得到了95%的准确率。In order to find the true authors of source codes in the corpus,this paper proposes a method of combining code coupling degree and program dependency graph(PDG)features to identify the authors of different program source codes.Firstly,the parameters,fan-in and fan-out features extracted from the source code are used to calculate the coupling degree of the code.Secondly,control and data dependencies are extracted from the converted program dependency graph,preprocessing technology is applied to convert PDG features into small instances with frequency details,and the frequency inverse document frequency technology is used to amplify the importance of each PDG feature in the source code.Finally,the CPNN model is used to predict the coding style characteristics of programmers,and the attributes of the real authors of the coding style are divided.The results show that the author attribution prediction on the source code data set of 1000 programmers has an accuracy of 95%.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222