检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]渤海大学信息科学与技术学院,辽宁锦州121013
出 处:《计算机技术与发展》2014年第4期103-106,共4页Computer Technology and Development
基 金:吉林省科技发展计划项目青年科研基金(201201070);辽宁省社科联项目(2010lslktjyx-03)
摘 要:为了提高数据的分类性能,提出了一种基于特征选择的Bagging分类算法。通过Fisher准则和互信息的方法给定一种能够直接评价特征区分度和与类别相关性的评价方法,重新构造了计算特征区分度和与类别相关性的计算公式。并将该方法应用到Bagging分类算法当中。实现了算法迭代过程中的特征选择,使得每个基分类器都是由不同的特征子集训练所得,保证了基分类器的独立性,降低了训练误差。通过理论分析和大量的实验,对文中的方法与经典特征选择方法进行了比较,实验结果显示文中的方法能够得到更高的预测精准度。In order to improve the classification performance of data,a Bagging classification algorithm based on feature selection is pro- posed in this paper. An evaluation method is proposed for full account of the discrimination and class information of each feature by the Fisher criterion and mutual information ,built on the formula about discrimination and class information. The feature selection algorithm is applied to the Bagging classification algorithm. The feature selection is implemented in the iterative process of algorithm, so that each base classifier is trained by different feature subsets, which ensures the independence of each base classifier, reducing the training error. Com- pared the method with several classical feature selection methods by theoretical analysis and extensive experiments, the results show that the method can achieve higher predictive accuracy.
关 键 词:数据挖掘 特征选择 集成学习 互信息 BAGGING 分类器
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.51.100