PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法被引量：9

PFPonCanTree:A parallel frequent patterns incremental mining algorithm based on MapReduce

出　　处：《计算机工程与科学》2018年第1期15-23,共9页Computer Engineering & Science

基　　金：安徽省高校自然科学研究项目(KJ2016A623)

摘　　要：频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以"批处理"方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要。MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用。将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘。实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升。Frequent pattern mining is one of the most important data mining tasks.Traditional frequent pattern mining algorithmsare executed in a " batch" mode,that is,all the data are mined in one time,so they cannotmeet the needs of the ever-growing bigdata mining.MapReduce is a popular parallel computing modeland has been widely used in the field of parallel data mining.In this paper,we migrate the traditional frequent pattern incremental mining algorithm CanTree to the MapReduce computing model,achieving aparallel frequent pattern incremental miningalgorithm.The experimental results show that the proposed algorithm achievesbetterload balancing and improvesthe execution efficiency significantly.

关键词：数据挖掘频繁模式挖掘增量挖掘 MAPREDUCE HADOOP PFP

分类号：TP311[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法被引量：9

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法 被引量：9

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法被引量：9