基于CUDA的k-means文档聚类算法并行优化  被引量:2

Parallel optimization algorithm for k-means document clustering based on CUDA

在线阅读下载全文

作  者:戴涛[1] 杨洲[2] 方勇[1] 景旭[1] 

机构地区:[1]西北农林科技大学信息工程学院,陕西杨凌712100 [2]北京计算机技术及应用研究所,北京100854

出  处:《计算机工程与设计》2013年第11期4032-4036,4071,共6页Computer Engineering and Design

基  金:国家自然科学基金项目(61271280;61001100);"十二五"国家科技支撑计划课题基金项目(2011BAD21B05)

摘  要:为提高k-means的大数据量计算速度,结合k-means算法计算密集和计算统一设备架构(CUDA)的特点,提出了寄存器优化的并行聚类算法和滑动门并行计算中心点算法。寄存器优化的并行聚类算法优化了聚类步骤,提高了GPU的寄存器利用率,降低了数据获取延迟;滑动门并行计算中心点算法优化了中心点计算步骤,避免了数据同步,提高了GPU计算核心的利用率。实验结果表明,并行优化的k-means算法在GTX 480上可获最高约137倍的加速比,有效地提高了k-means算法在单机上的运行效率。To enhance the computation speed of k-means document clustering combining computationally intensive feature, register optimized parallel algorithm for clustering process and sliding doors parallel algorithm for computing center point process are proposed based on compute unified device architecture (CUDA). Register optimized parallel algorithm for clustering process improves utilization rate and reduces data acquisition delay of GPU; Sliding doors parallel algorithm for computing center point process utilizes GPU core much more efficiently while avoiding data synchronization. Experimental results show that the proposed parallel optimization algorithm gets the speed up ratio of more than 137 times and improves the operation efficiency of the k-means algorithm running in the stand-alone environment.

关 键 词:K-MEANS 文档聚类 CUDA 并行计算 GPU 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象