基于云计算的Apriori挖掘算法  被引量:6

An Apriori Mining Algorithm Based on Cloud Computing

在线阅读下载全文

作  者:吴琪[1] 

机构地区:[1]广东警官学院,广东广州510440

出  处:《计算机测量与控制》2012年第6期1653-1655,共3页Computer Measurement &Control

基  金:国家自然科学基金(60473003);2009广东警官学院科研项目(2009-Z09)

摘  要:MapReduce是云计算技术主流的分布式计算模型,它充分利用计算机集群的处理能力;能对大规模数据进行高效的挖掘分析;在研究MapReduce模型架构的基础上,将云计算技术与数据挖掘技术结合在一起,提出了基于MapReduce模型的Apriori算法;该算法对事务集和项集进行双重二进制编码,只需"与"运算和"或"运算,提高了模式匹配和连接的效率;试验结果表明,该算法执行效率比传统集中式Apriori算法有很大幅度的提高。MapReduce is a major distributed computing mode on cloud computing. It takes full use of computer processing power of clusters, thus could handle data analysis tasks over large scale data. After MapReduce architecture is studied, the paper combines the cloud computing and data mining technology, and then proposes this algorithm based on MapReduce. This algorithm converts trade set and item set to Binary, just "AND" operation and "OR" operation to improve the efficiency of pattern matching and connection. The experimental result shows this algorithm makes a sharp increase in efficiency compared with centralized Apriori algorithm.

关 键 词:关联规则 APRIORI算法 云计算 MAPREDUCE模型 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象