评估子集类区分能力的特征选择方法  被引量:3

A feature selection approach to estimate discriminationcapability of feature subset category

在线阅读下载全文

作  者:宋恩民[1] 黄东山[1] 马光志[1] 肖强[2] 

机构地区:[1]华中科技大学计算机科学与技术学院,湖北武汉430074 [2]华中科技大学附属医院,湖北武汉430074

出  处:《华中科技大学学报(自然科学版)》2011年第2期1-5,共5页Journal of Huazhong University of Science and Technology(Natural Science Edition)

基  金:国家高技术研究发展计划资助项目(2006AA02Z347);科技部国际科技合作项目(2009DFA12290)

摘  要:为了克服Relief选择前k个特征作为约简子集所存在的原始特征空间中的近邻在约简后的特征子空间中不一定还是近邻的问题,提出了一种在特征子空间中评价候选特征子集类别区分能力的方法,并结合最好优先特征搜索策略提出了一种新的特征子集选取方法.在12个UCI(加州大学欧文分校)数据集和1个老年痴呆实测数据集上,就约减能力对所提方法与其他3种经典特征选择方法进行了比较,并用决策树、逻辑回归模型详细比较了分类效果.实验结果表明:所提方法不仅能够选出特征数目较少的特征子集,而且特征子集的分类效果良好.The nearest neighbor of a sample in original feature space does not necessarily hold in the reduced feature space. To overcome above problem of Relief that select top k features as a reduced fea- ture subset, a feature subset evaluation method was proposed to assess the discrimination capability of a feature subset in reduced feature subset space. Combining the evaluation method with the best-first search strategy, a new feature subset selection method was developed. This method was compared with three classical feature selection approaches by using decision tree and logistic regression algo- rithms on 12 UCI (University of California Irvine) data sets and Alzheimer's disease truth data. Experimental results demonstrate that not only this method is able to select a feature subset with smaller number of features for most data sets, but also the performance of classification is excellent in most cases.

关 键 词:特征选择 特征子集 特征评价 分类 老年痴呆症 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象