检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘文杰[1] 江贺[1] LIU Wenjie;JIANG He(School of Software Technology,Dalian University of Technology,Dalian,Liaoning 116621,China)
机构地区:[1]大连理工大学软件学院
出 处:《计算机工程》2019年第8期80-85,共6页Computer Engineering
基 金:国家自然科学基金“超启发式算法的多视角分析及应用研究”(61175062)
摘 要:针对Bugzilla缺陷跟踪系统的Eclipse项目软件缺陷报告数据集,使用特征选择和机器学习算法对向量化的原始数据进行特征降维、权重优化等处理,得到数据维度较低的优化数据集,并采用分类算法评估软件缺陷报告严重程度。通过对4种特征选择算法及4种机器学习算法处理结果的交叉对比表明,使用信息增益特征选择算法对原始数据集进行特征优化,并结合多项式贝叶斯算法对优化数据集进行训练与测试,可使软件缺陷报告严重性预测的AUROC值提高至0.767。To address the datasets of Eclipse project software defect reports of Bugzilla defect tracking system,feature selection and machine learning algorithms are used to perform feature dimension reduction and weight optimization on vectorized original data to obtain optimized dataset with lower data dimension,and classification algorithms are used to evaluate the severity of software defect reports.The cross-comparison results of the four feature selection algorithms and the four machine learning algorithm results show that the Information Gain(IG) feature selection algorithm is used to perform feature optimization on the original dataset,and the optimized dataset is trained and tested by using the Multinamial Naive Bayes(MNB) algorithm.The AUROC value of the severity prediction of software defect reports can be increased to 0.767.
关 键 词:开源软件 软件缺陷报告 特征选择 机器学习 严重性评估 修复率
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145