基于特征选择的Bagging分类算法研究  被引量:8

Research on Bagging Classification Algorithm Based on Feature Selection

在线阅读下载全文

作  者:姚明海[1] 赵连朋[1] 刘维学[1] 

机构地区:[1]渤海大学信息科学与技术学院,辽宁锦州121013

出  处:《计算机技术与发展》2014年第4期103-106,共4页Computer Technology and Development

基  金:吉林省科技发展计划项目青年科研基金(201201070);辽宁省社科联项目(2010lslktjyx-03)

摘  要:为了提高数据的分类性能,提出了一种基于特征选择的Bagging分类算法。通过Fisher准则和互信息的方法给定一种能够直接评价特征区分度和与类别相关性的评价方法,重新构造了计算特征区分度和与类别相关性的计算公式。并将该方法应用到Bagging分类算法当中。实现了算法迭代过程中的特征选择,使得每个基分类器都是由不同的特征子集训练所得,保证了基分类器的独立性,降低了训练误差。通过理论分析和大量的实验,对文中的方法与经典特征选择方法进行了比较,实验结果显示文中的方法能够得到更高的预测精准度。In order to improve the classification performance of data,a Bagging classification algorithm based on feature selection is pro- posed in this paper. An evaluation method is proposed for full account of the discrimination and class information of each feature by the Fisher criterion and mutual information ,built on the formula about discrimination and class information. The feature selection algorithm is applied to the Bagging classification algorithm. The feature selection is implemented in the iterative process of algorithm, so that each base classifier is trained by different feature subsets, which ensures the independence of each base classifier, reducing the training error. Com- pared the method with several classical feature selection methods by theoretical analysis and extensive experiments, the results show that the method can achieve higher predictive accuracy.

关 键 词:数据挖掘 特征选择 集成学习 互信息 BAGGING 分类器 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象