一种快速、鲁棒的有限高斯混合模型聚类算法  被引量:15

Rapid Robust Clustering Algorithm for Gaussian Finite Mixture Model

在线阅读下载全文

作  者:胡庆辉[1,2,3] 丁立新[1,2] 陆玉靖[3] 何进荣[1,2] 

机构地区:[1]武汉大学软件工程国家重点实验室,武汉430072 [2]武汉大学计算机学院,武汉430072 [3]桂林航天工业学院信息工程系,桂林541004

出  处:《计算机科学》2013年第8期191-195,共5页Computer Science

基  金:国家自然科学基金(60975050);中央高校基本科研业务费专项基金(6081014);武汉大学研究生自主科研项目(2012211020209)资助

摘  要:有限混合模型聚类是一种基于概率模型的有效聚类方法。针对高斯混合模型的聚类算法,分别对模型的成分混合系数及样本所属成分的概率系数施加熵惩罚算子,实现对模型成分数的两级控制,快速消除无效成分,使算法能在很少的迭代次数内收敛到确定解。传统算法对初始值(成分数目c需事先指定)的设置非常敏感,容易导致EM算法陷入局部最优解或收敛到解空间的边界,而文中的算法对初始值的设定没有特殊的要求,实验证明其具有很好的鲁棒性。Finite mixture model is an effective clustering method based on probability model. Aiming at the clustering algorithm of Gaussian mixture model. This paper imposed entropy penalized operators on the mixed coefficients of com- ponents and the labels of samples respectively, which brings to two levels controls for the number of components and rapid reduction of the illegitimate ones. Thus the algorithm converges to exact solutions with only a few iterations. Since the traditional algorithm is very sensitive to the initial values (for example, the number of components must be set in ad- vance), which often leads to the EM algorithm to fall into local optima or converges to the boundary of the solution space, the new algorithm of this paper is very robust and has no special demands for the initializations ,just testified by the experiments.

关 键 词:高斯混合模型 聚类 信息熵 EM算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象