分批处理的K-means算法并行实现  被引量:2

Parallel Implementation of K-means Algorithm with Batch Processing

在线阅读下载全文

作  者:兰远东[1] 刘宇芳[1] 徐涛[1] 

机构地区:[1]惠州学院计算机科学系,广东惠州516007

出  处:《计算机工程》2012年第13期145-147,151,共4页Computer Engineering

基  金:国家"863"先进制造领域基金资助重点项目(2006AA04A120);广东高校优秀青年创新人才培养计划基金资助项目(LYM09128)

摘  要:为解决K-means算法计算量大、收敛缓慢、运算耗时长等问题,给出一种新的K-means算法的并行实现方法。在通用计算图形处理器架构上,使用统一计算设备架构(CUDA)加速K-means算法。采用分批原则,更合理地运用CUDA提供的各种存储器,避免访问冲突,同时减少对数据集的访问次数,以提高算法效率。在大规模数据集中的实验结果表明,该算法具有较快的聚类速度。K-means algorithm is computationally intensive, time consuming and convergence slow. In order to solve the problem of K-means algorithm, a new set of parallel solution of K-means algorithm is presented. In the General Purpose computation on Graphics Processing Unit(GPGPU) architecture, Compute Unified Device Architecture(CUDA) is used to accelerate K-means algorithm. Based on batch principle, the algorithm uses CUDA's memory more rationally, to avoid access conflict, reduce the number of times of visits for data sets, and improve the , efficiency of K-means algorithm. Experimental result in large-scale data set shows that the algorithm has a faster clustering speed.

关 键 词:数据挖掘 K-MEANS算法 统一计算设备架构 并行算法 聚类分析 图形处理器 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象