基于特征选择的软件缺陷报告严重性评估  被引量:6

Severity Assessment of Software Defect Reports Based on Feature Selection

在线阅读下载全文

作  者:刘文杰[1] 江贺[1] LIU Wenjie;JIANG He(School of Software Technology,Dalian University of Technology,Dalian,Liaoning 116621,China)

机构地区:[1]大连理工大学软件学院

出  处:《计算机工程》2019年第8期80-85,共6页Computer Engineering

基  金:国家自然科学基金“超启发式算法的多视角分析及应用研究”(61175062)

摘  要:针对Bugzilla缺陷跟踪系统的Eclipse项目软件缺陷报告数据集,使用特征选择和机器学习算法对向量化的原始数据进行特征降维、权重优化等处理,得到数据维度较低的优化数据集,并采用分类算法评估软件缺陷报告严重程度。通过对4种特征选择算法及4种机器学习算法处理结果的交叉对比表明,使用信息增益特征选择算法对原始数据集进行特征优化,并结合多项式贝叶斯算法对优化数据集进行训练与测试,可使软件缺陷报告严重性预测的AUROC值提高至0.767。To address the datasets of Eclipse project software defect reports of Bugzilla defect tracking system,feature selection and machine learning algorithms are used to perform feature dimension reduction and weight optimization on vectorized original data to obtain optimized dataset with lower data dimension,and classification algorithms are used to evaluate the severity of software defect reports.The cross-comparison results of the four feature selection algorithms and the four machine learning algorithm results show that the Information Gain(IG) feature selection algorithm is used to perform feature optimization on the original dataset,and the optimized dataset is trained and tested by using the Multinamial Naive Bayes(MNB) algorithm.The AUROC value of the severity prediction of software defect reports can be increased to 0.767.

关 键 词:开源软件 软件缺陷报告 特征选择 机器学习 严重性评估 修复率 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象