基于半监督K-means的K值全局寻优算法  被引量:11

Global Optimising K Value for Semi-Supervised K-means Algorithm

在线阅读下载全文

作  者:孙雪[1] 李昆仑[1] 胡夕坤[2] 赵瑞[1] 

机构地区:[1]河北大学电子信息工程学院,河北保定071002 [2]河北大学工商学院,河北保定071000

出  处:《北京交通大学学报》2009年第6期106-109,共4页JOURNAL OF BEIJING JIAOTONG UNIVERSITY

基  金:国家自然基金资助项目(60773062;60873100);河北省科技支撑计划项目资助(072135188);河北省教育厅科研计划项目资助(2008312)

摘  要:提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.In this paper, we propose a global optimising K value for semi-supervised K-means algorithm. It has broken the limits that traditional methods have in selecting samples as the K value. It can direct and plan a great amount of supervision data by using only a small amount of labled data. Combining the distribution characteristics of data sets and monitoring information in each cluster after clustering, we use the voting rule to guide the cluster labeling in the data sets. The experiments show that the method proposed in this paper can effectively find the best data sets for K values and clustering center and enhancing the performance of clustering.

关 键 词:半监督聚类 constrained—K均值 K均值算法 投票 阈值 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象