分布式MVC-Kmeans算法设计与实现  被引量:3

在线阅读下载全文

作  者:汪晶 邹学玉[1] 喻维明 孙咏 

机构地区:[1]长江大学电子信息学院

出  处:《长江大学学报(自然科学版)》2019年第6期113-119,共7页Journal of Yangtze University(Natural Science Edition)

基  金:国家自然科学青年科学基金项目(61701046);国家自然科学基金项目(61273179)

摘  要:针对K-means算法聚类质量和收敛速度取决于初始聚类中心选取的问题,提出了一种利用最小方差获取Canopy最优全局中心作为K-means聚类中心初值的算法,并利用Hadoop平台MapReduce编程模型进行了分布式MVC-Kmeans算法的设计与实现。标准UCI数据集测试结果表明,与传统K-means聚类算法相比,该算法可以得到更好的聚类质量,且收敛速度更快,适于大规模数据的聚类分析。

关 键 词:Hadoop云平台 K-MEANS聚类 Canopy算法 最小方差 大规模数据 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象