Binary-Positive下的并行化CURE算法  被引量:3

Parallel CURE algorithm with Binary-Positive

在线阅读下载全文

作  者:王民[1] 尹超[1] 王稚慧[1] 要趁红[1] 高婧[1] 

机构地区:[1]西安建筑科技大学信息与控制工程学院,西安710055

出  处:《计算机工程与应用》2014年第11期58-61,共4页Computer Engineering and Applications

基  金:国家自然科学基金(No.61073196);陕西省教育厅专项科研计划项目基金(No.11JK0982)

摘  要:当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。For random sampling is not representative, it proposes a robust parallel improvement of algorithms when using CURE algorithm to handle non-uniform mass data. It uses the Binary-Positive algorithm to get the effective properties of the data, uses valid data for hierarchical clustering with MapReduce, which is a distributed parallel framework. It achieves the correct rate and efficiency of a trade-off. The tests show that the improved CURE algorithm has a higher efficiency in the implementation and has a good clustering result.

关 键 词:聚类 利用代表点聚类(CURE) Binary—Positive MAPREDUCE 并行 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象