检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广东外语外贸大学信息学院,广州510006 [2]广东外语外贸大学国际工商管理学院,广州510006
出 处:《计算机工程与应用》2010年第20期153-156,共4页Computer Engineering and Applications
基 金:国家自然科学基金No.60673191;广东省自然科学基金No.9151026005000002;广东省高等学校自然科学研究重点项目(No.06Z012)~~
摘 要:提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。This paper proposes a feature selection algorithm based on feature similarity measure.The method clusters features based on similarity measure and then chooses representative features from each cluster.At last,the feature subset is selected by removing the feature which is less relevant or irrelevant to class feature.Theory analysis indicates that the method with lower time complexity can be applied in feature selection for high dimensional data.The superiority of the algorithm,in terms of dimensionality reduction and classification performance,is established extensively over UCI datasets through comparing with other classic feature selection approaches.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249