检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:喻皓 张莹 李倩 姜立标 尚云鹏[5] YU Hao;ZHANG Ying;LI Qian;JIANG Libiao;SHANG Yunpeng(GAC Aion New Energy Automobile Co.,Ltd.,Guangzhou 511400,P.R.China;Syncore Autotech Co.,Ltd.,Guangzhou 510335,P.R.China;The Fifth Research Institute of Electronics,Ministry of Industry and Information Technology,Guangzhou 510463,P.R.China;School of Mechanical Engineering and Robotics,,Guangzhou City University of Technology,Guangzhou 510800,P.R.China;Institute of Engineering Research,Guangzhou City University of Technology,Guangzhou 510800,P.R.China;School of Mechanical&Automotive Engineering,South China University of Technology,Guangzhou 510641,P.R.China)
机构地区:[1]广汽埃安新能源汽车股份有限公司研发中心,广州511400 [2]星河智联汽车科技有限公司,广州510335 [3]工业和信息化部电子第五研究所,广州510463 [4]广州城市理工学院机械工程学院与机器人学院,广州510800 [5]广州城市理工学院工程研究院,广州510800 [6]华南理工大学机械与汽车工程学院,广州510641
出 处:《重庆大学学报》2025年第2期10-21,共12页Journal of Chongqing University
基 金:国家自然科学基金(61602345)。
摘 要:在机器学习技术逐渐渗透到各个领域的背景下,软件开发流程中的软件测试非常重要,面对在软件缺陷预测过程中出现的类别不平衡和准确性问题,提出一种基于监督学习的解决方案,采用样本平衡技术,结合合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)与编辑最近邻(edited nearest neighbor,ENN)算法,对局部加权学习(local weight learning,LWL)、J48、C4.8、随机森林、贝叶斯网络(Bayes net,BN)、多层前馈神经网络(multilayer feedforward neural network,MFNN)、支持向量机(supported vector machine,SVM)以及朴素贝叶斯(naive Bayes key,NB-K)等多种算法进行测试。这些算法被应用于NASA数据库的3个不同数据集(KK1,KK3,PK2),并对其效果进行详细比较分析。研究结果显示,结合了SMOTE和ENN的随机森林模型在处理类别不平衡问题方面展现出高效且避免过拟合的优势,为解决软件缺陷预测中的类别不平衡提供了一种有效的解决方案。With the gradual penetration of machine learning technology into various fields,software testing in the software development process is very important.Software defect prediction faces class imbalance problem and accuracy issue.This paper proposes a supervised learning-based software prediction method for solving these two core problems.The method adopts sample balancing technique,combined with synthetic minority over-sampling technique(SMOTE)and edited nearest neighbor(ENN)algorithm,to test local weight learning(LWL),J48,C4.8,random forest,Bayes net(BN),multilayer feedforward neural network(MFNN),supported vector machine(SVM),and naive Bayes key(NB-K).These algorithms are applied to three different datasets(KK1,KK3 and PK2)in the NASA database and their effects are compared and analyzed in detail.The results show that the random forest model combining SMOTE and ENN exhibits high efficiency and avoiding overfitting in dealing with class imbalance problems,which provides an effective way to solve the problem in software defect prediction.
关 键 词:软件缺陷预测 机器学习 类不平衡 XGBoost 随机森林
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.131.162