检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王民[1] 尹超[1] 王稚慧[1] 要趁红[1] 高婧[1]
机构地区:[1]西安建筑科技大学信息与控制工程学院,西安710055
出 处:《计算机工程与应用》2014年第11期58-61,共4页Computer Engineering and Applications
基 金:国家自然科学基金(No.61073196);陕西省教育厅专项科研计划项目基金(No.11JK0982)
摘 要:当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。For random sampling is not representative, it proposes a robust parallel improvement of algorithms when using CURE algorithm to handle non-uniform mass data. It uses the Binary-Positive algorithm to get the effective properties of the data, uses valid data for hierarchical clustering with MapReduce, which is a distributed parallel framework. It achieves the correct rate and efficiency of a trade-off. The tests show that the improved CURE algorithm has a higher efficiency in the implementation and has a good clustering result.
关 键 词:聚类 利用代表点聚类(CURE) Binary—Positive MAPREDUCE 并行
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.192.51