基于特征相关性的特征选择  被引量:16

Feature selection based on feature similarity measure

在线阅读下载全文

作  者:蒋盛益[1] 王连喜[2] 

机构地区:[1]广东外语外贸大学信息学院,广州510006 [2]广东外语外贸大学国际工商管理学院,广州510006

出  处:《计算机工程与应用》2010年第20期153-156,共4页Computer Engineering and Applications

基  金:国家自然科学基金No.60673191;广东省自然科学基金No.9151026005000002;广东省高等学校自然科学研究重点项目(No.06Z012)~~

摘  要:提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。This paper proposes a feature selection algorithm based on feature similarity measure.The method clusters features based on similarity measure and then chooses representative features from each cluster.At last,the feature subset is selected by removing the feature which is less relevant or irrelevant to class feature.Theory analysis indicates that the method with lower time complexity can be applied in feature selection for high dimensional data.The superiority of the algorithm,in terms of dimensionality reduction and classification performance,is established extensively over UCI datasets through comparing with other classic feature selection approaches.

关 键 词:特征选择 相关度 特征聚类 分类 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象