检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴晓璇[1,2] 倪志伟[1,2] 倪丽萍[1,2]
机构地区:[1]合肥工业大学管理学院商务智能研究所,合肥230009 [2]合肥工业大学过程优化与智能决策教育部重点实验室,合肥230009
出 处:《计算机工程与应用》2015年第14期1-6,10,共7页Computer Engineering and Applications
基 金:国家自然科学基金(No.71271071;No.71301041);国家"863"云制造主题项目(No.2011AA040501)
摘 要:传统的聚类算法不适用于处理海量和高维数据。针对云计算环境下,利用集群系统的并行计算能力,实现海量数据的聚类问题,给出了云计算环境下基于分形维数的聚类融合算法。该算法首先对基于分形维数的聚类算法进行改进,使之更适用于并行计算,其产生聚类作为初始聚类成员;再结合投票算法的融合策略实现融合。最后,对基于分形维数的聚类融合算法在云计算环境下实现并行计算。通过在UCI数据集上的对比实验来验证该算法的有效性。The traditional clustering algorithms are not fit for dealing with mass and high dimensional data in practical application. In view of the cloud computing environment, to use cluster system parallel computing ability, to realize mass data clustering problems, a fractal dimension clustering ensemble algorithm based on cloud computing environment is proposed in this paper. Firstly, a cluster algorithm based on fractal which results as the initial clustering members is improved,and it is more suitable for parallel computing. Then, the clustering members are integrated by using the voting algorithm.At last, the proposed algorithm in cloud computing environment is realized parallel computing. The experimental results on UCI data set verify the validity of the proposed algorithm.
关 键 词:云计算 HADOOP 分布式计算 分形维数 聚类融合
分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.120