检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:闫岭岭 江峰[1] 杜军威[1] 杨爱光[1] YAN Ling-ling;JIANG Feng;DU Jun-wei;YANG Ai-guang(College of Information Science & Technology, Qingdao University of Science and Technology, Qingdao 266061, China)
机构地区:[1]青岛科技大学信息科学技术学院,山东青岛266061
出 处:《计算机与现代化》2021年第8期70-76,84,共8页Computer and Modernization
基 金:国家自然科学基金资助项目(61973180,61671261);山东省自然科学基金资助项目(ZR2018MF007)。
摘 要:现有的软件缺陷预测方法面临数据类别不平衡性、高维数据处理等问题。如何有效解决上述问题已成为目前相关领域的研究热点。针对软件缺陷预测所面临的类别不平衡、预测精度低等问题,本文提出一种基于混合采样与Random_Stacking的软件缺陷预测算法DP_HSRS。DP_HSRS算法首先采用混合采样算法对不平衡数据进行平衡化处理;然后在该平衡数据集上采用Random_Stacking算法进行软件缺陷预测。Random_Stacking算法是对传统Stacking算法的一种有效改进,它通过融合多个经典的分类算法以及Bagging机制构建多个Stacking分类器,对多个Stacking分类器进行投票,得到一个集成分类器,最后利用该集成分类器对软件缺陷进行预测。通过在NASA MDP数据集上的实验结果表明,DP_HSRS算法的性能优于现有的算法,具有更好的缺陷预测性能。The existing software defect prediction methods face problems such as imbalance of data categories,high-dimensional data processing,and so on.How to effectively solve the above problems has become a research hotspot in related fields.Aiming at the problems of unbalanced categories and low prediction accuracy faced by software defect prediction,this paper proposes a software defect prediction algorithm DP_HSRS based on hybrid sampling and Random_Stacking.The DP_HSRS algorithm firstly uses a hybrid sampling algorithm to balance the unbalanced data,then uses the Random_Stacking algorithm to predict software defects on the balanced data set.The Random_Stacking algorithm is an effective improvement to the traditional Stacking algorithm.It constructs multiple Stacking classifiers by fusing multiple classic classification algorithms and the Bagging mechanism,votes multiple Stacking classifiers to obtain an integrated classifier,and finally uses the integrated classifier to predict software defects.The results of experiments on the NASA MDP data set show that the performance of the DP_HSRS algorithm is better than the existing algorithms,and it has better defect prediction performance.
关 键 词:软件缺陷预测 数据不平衡 混合采样 Random_Stacking DP_HSRS
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145