检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海大学计算机工程与科学学院,上海200072 [2]青岛大学信息工程学院,山东青岛266071
出 处:《计算机工程与应用》2012年第34期11-16,59,共7页Computer Engineering and Applications
基 金:国家自然科学基金(No.61170106)
摘 要:提出了一种新的多分类器融合算法。对特征的提取以约简为基础,按照一定的策略添加若干个属性重要度和特征贡献率大的特征,构成一个融合的特征子集空间;接着借助于kNN的思想,计算测试样本的k个最邻近点的类别百分比,为了提高分类精度,引入了样本相似度测度测试样本与k个最邻近点的相似性,通过设置合适的类别百分比和样本相似度的阈值,最终确定测试样本的类别归属。6个UCI标准数据集的实验分析表明,算法是有效的、可行的。详细分析了不同的约简和不同的阈值对分类精度的影响。The feature extraction is based on a reduction, and then to add several features that the value of attribute significance or contribution rate is large according to certain strategy, the feature subset space combined is constituted. With the idea of kNN, to calculate the category percentage of the k-nearest neighbors around the test sample. In order to improve the classification accuracy, the sample similarity measure is introduced to calculate the similarity between the test samples and k-nearest neighbors. By setting the appropriate threshold of the category percentage and the sample similarity, to ultimately determine the category of the test samples. The algorithm' s validity and feasibility have been verified by six multidimensional data sets from UCI. The impact of the different reductions and different thresholds for classification accuracy is analysed detailedly.
关 键 词:邻域粗糙模型 约简 属性重要度 特征贡献率 融合特征子空间 样本相似度
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7