检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵宇[1] 祝义[1,2] 于巧 陈小颖 ZHAO Yu;ZHU Yi;YU Qiao;CHEN Xiaoying(School of Computer Science and Technology,Jiangsu Normal University,Xuzhou,Jiangsu 221116,China;School of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)
机构地区:[1]江苏师范大学计算机科学与技术学院,江苏徐州221116 [2]南京航空航天大学计算机科学与技术学院,南京210016
出 处:《计算机工程与应用》2021年第20期279-286,共8页Computer Engineering and Applications
基 金:国家自然科学基金青年项目(61902161);江苏省高等学校自然科学研究面上项目(18KJB520016);江苏省博士后基金(1501055B);徐州市应用基础研究计划(KC19004);江苏师范大学自然科学研究基金-博士学位教师科研支持项目(17XLR001);江苏师范大学研究生科研创新项目(KYCX20_2384)。
摘 要:跨项目缺陷预测旨在解决传统的项目内缺陷预测的历史数据缺失,新项目初期缺乏训练数据等实际问题。然而,在跨项目缺陷预测中,不同项目之间以及实例之间的数据分布差异降低了其预测性能。针对这一问题,提出了基于分层数据筛选的跨项目缺陷预测方法。该方法将训练数据的筛选过程分为项目层筛选和实例层筛选,从源数据集中选出与目标项目数据分布最接近的候选项目集,在候选项目集中选出与目标项目中实例相似度较高的训练数据集,最后在训练数据集上训练朴素贝叶斯模型。在PROMISE数据集进行实验对比。结果表明,与项目内缺陷预测比较,提出的分层数据筛选方法优于项目内缺陷预测,并且有效降低了训练数据和目标项目数据之间的差异性。Cross-project defect prediction aims to solve the practical problems such as the lack of historical data of traditional within-project defect prediction and the lack of training data in the initial stage of new projects.However,in cross project defect prediction,the difference in data distribution between different projects and instances reduces its prediction performance.In response to this problem,a cross project defect prediction method based on hierarchical data screening is proposed.This method divides the screening process of training data into project-level screening and instance-level screening.Firstly,the candidate project set closest to the target project data distribution is selected from the source dataset.Secondly,the candidate project set is selected to be similar to the instance in the target project.Training dataset is with higher similary,and finally it trains the Naive Bayes model on the training dataset.Experiment is done in PROMISE dataset.The results show that compared with in-project defect prediction,the hierarchical data screening method proposed is superior to within project defect prediction,and effectively reduces the difference between training data and target project data.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222