检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军信息工程大学密码工程学院,郑州450001 [2]解放军信息工程大学指挥军官基础教育学院,郑州450001
出 处:《计算机应用研究》2015年第12期3596-3599,共4页Application Research of Computers
基 金:国家"863"计划资助项目(2012AA012704);郑州市科技领军人才项目(131PLJRC644)
摘 要:针对面向聚类的特征选择算法效率和效果无法兼顾,并且对高维数据适用度不高的问题,提出了一种基于邻域分析的加权特征选择算法ENFSA。该算法首先基于信息熵构建候选特征集,降低加权特征选择的候选特征维度,在此基础上采用邻域分析法评估特征冗余度和相关性,并根据评估结果更新特征子集和权值向量,不断迭代,直至特征权值向量趋于稳定。在10种典型数据集上的测试结果表明,与传统的特征选择算法相比,新的算法特征约简效率较好,能够明显提高数据集聚类效果,同时在特征维度较高的数据集上依然表现出很好的效果。Aiming at the problem that the efficiency and performance of traditional feature selection are not compatible and it cannot be well applied to high-dimensional data, this paper proposed a neighborhood analysis based weighted feature selection algorithm(ENFSA). ENFSA created a candidate feature set based on information gain to reduce the number of dimensions. Then it assessed the redundancy and relevance of features based on neighborhood analysis and used them to update feature set and weight vector. This assessment and update process would be repeated until optimal result was obtained. Experimental resuits on 10 typical datasets show that this method has good efficiency and performance, and it do better on high-dimensional dataset than other algorithms.
关 键 词:加权特征选择 聚类 信息熵 邻域分析 特征权值向量
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28