检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国石化勘探南方分公司研究院,四川成都610041 [2]中国地质大学(武汉)计算机学院,湖北武汉430074
出 处:《计算机仿真》2008年第3期126-128,133,共4页Computer Simulation
摘 要:在分类算法和回归模型中,融合方法正得到越来越广泛的应用,但在非监督机器学习领域,由于缺乏数据集的先验知识,则不能直接用于聚类算法。提出并实现了一种基于投票策略的聚类融合算法,该算法利用k-means算法每次随机选取聚类中心而得到不同样本划分的特性,将多次运行得到的聚类结果通过投票的方式合并,从而得到最终的结果。通过一系列真实数据和合成数据集的实验证明,这种方法比单一的聚类算法能更有效地提高聚类的准确率。在此基础上,为了降低高维数据运算的复杂性,将随机划分属性子空间的方法应用到上述聚类融合算法中,实验证明,该方法同时也能够在一个属性子空间上获得好的聚类结果。In the classification and regression algorithms, the ensemble method was widely used, but in the unsupervised learning, it didn' t be used in the clustering algorithm directly due to lack of prior knowledge. This paper proposed a clustering ensembles algorithm based on voting strategy, it used the characteristic that the k - means algorithm selected the clustering centers randomly and found the different partitions of the sample. Then, it combined the clustering results of operating the k - means algorithm repeatedly to a final result via the voting strategy. Through the experiment on lots of real data and artificial data, this method could receive a better result than the single clustering algorithm. Moreover, to resolve the complexity of the high dimension data, a method for partitioning the feature space randomly in the ensemble algorithm was used. It proved that this method is able to receive a good clustering result in the attribute subspace by the experiment.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3