检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东北大学秦皇岛分校计算机工程系,秦皇岛066004 [2]西安交通大学电子与信息工程学院,西安710049
出 处:《计算机科学》2007年第10期195-199,共5页Computer Science
基 金:本课题得到东北大学985工程;科技创新平台;"基于内容的并行图像检索技术的研究"和"无线移动自组网络安全技术研究";河北省教育厅2006年科研计划(Z2006303)资助
摘 要:本文的目的就是通过理论分析和试验,探讨集群环境下并行聚类算法的设计思想。作为一种低成本、通用并行系统,集群系统的通讯能力相对于节点的计算能力是一个瓶颈。所以本文提出,在集群环境下设计并行聚类算法时,应采用数据并行的思想。本文首先从理论上,对采用数据并行思想后影响加速比的因素和通讯策略的选择进行了分析,然后实现了一个新的并行聚类算法——PARC算法。通过PARC算法的实验,证明了理论分析的正确性,并且表明并行聚类算法可以得到良好的聚类质量。本文的研究结果可以为以后设计更好的数据并行聚类算法提供一定的理论依据。The goal of this paper is to discuss the designing ideal of a parallel clustering algorithm for Cluster System. As a kind of low-cost all-purpose parallel computing system, the bottleneck of Cluster System is the communication ability compared to the computing ability. This paper proposes the idea of adopting data parallelism when designing a parallel clustering algorithm for Cluster System. Firstly, this paper theoretically analyzes the influence of the speedup and the choice of communication scheme. And then develops a parallel clustering algorithm named PARC. The experiments prove the correctness of the theoretical analysis and show that parallel clustering algorithm could obtain good quality of clustering as linear clustering algorithm. This theoretical analysis will help us to design better parallel clustering algorithm based on Cluster System.
关 键 词:数据挖掘 聚类算法 并行计算 集群 通讯 数据并行
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.226.88.145