基于Boosting的集成k-NN软件缺陷预测方法  被引量:7

Boosting-Based k-NN Learning for Software Defect Prediction

在线阅读下载全文

作  者:何亮[1] 宋擒豹[1] 沈钧毅[1] 

机构地区:[1]西安交通大学电子与信息工程学院,西安710049

出  处:《模式识别与人工智能》2012年第5期792-802,共11页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金资助项目(No.90718024)

摘  要:软件缺陷预测是改善软件开发质量,提高测试效率的重要途径.文中提出一种基于软件度量元的集成k-NN软件缺陷预测方法.首先,该方法在不同的Bootstrap抽样数据集上迭代训练生成一个基本k-NN预测器集合.然后,这些基本预测器分别对软件模块进行独立预测,各基本预测值将被融合生成最终的预测结果.为判别新的软件模块是否为缺陷模块,设计分类阈值的自适应学习方法.集成预测结果大于该阈值的模块将被识别为缺陷模块,反之则为正常模块.NASAMDP及PROMISEAR标准软件缺陷数据集上的实验结果表明集成k-NN缺陷预测的性能较之广泛采用的对比缺陷预测方法有较明显的提高,同时也证明软件度量元在缺陷预测中的有效性.Timely identification of defective modules improves both software quality and testing efficiency. A software metrics-based ensemble k-NN algorithm is proposed for software defect prediction. Firstly, a set of base k-NN predictors is constructed iteratively from different bootstrap sampling datasets. Next, the base k-NN predictors estimate the software module independently and their individual outputs are combined as the composite result. Then, an adaptive threshold training approach is designed for the ensemble to classify new software modules. If the composite result is greater than the threshold value, the software module is recognized as defective, otherwise as normal. Finally, the experiments are conducted on NASA MDP and PROMISE AR datasets. Compared with a widely referenced defect prediction approach, the results show the considerable improvements of the ensemble k-NN and prove the effectiveness of software metrics in defect prediction.

关 键 词:软件缺陷预测 k-近邻(k-NN) 软件度量元 集成学习 

分 类 号:TP311.53[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象