一种基于位图计算并行挖掘大数据频繁模式算法  被引量:5

Parallel Mining Frequent Patterns in Big Data Based on Bitmap Computation

在线阅读下载全文

作  者:陈辉[1] 

机构地区:[1]江西财经大学软件与通信工程学院,南昌330012

出  处:《小型微型计算机系统》2014年第7期1599-1603,共5页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(61262033;61262009;61363075)资助;江西省教育厅科技项目(GJJ13303)资助

摘  要:设计了一种基于MapReduce框架并行挖掘大数据频繁模式的算法,算法首先研究了运用位图计算发现数据集频繁模式的方法;并对传统MapReduce框架进行扩展,增加了位图计算和不重要模式剪枝等计算功能;为了提高大数据模式挖掘的性能,还设计模式剪枝算法来识别并删除数据集中的不重要模式.最后,实验结果表明,该算法具有很强的可扩展性,并优于其它同类算法.This paper proposed a parallel algorithm of mining frequent patterns in big data using extended MapReduce. First,we analyze the frequent pattern mining method using bitmap computation by scanning the dataset only once. Secondly,we extended the traditional MapReduce frame by adding the bitmap computation and frequent mining function. In order to improve the performance of mining big data,an algorithm of pruning insignificant patterns in dataset is also presented. Finally,the experimental results show that the proposed method is efficient,strong in scalability,and prior to analogous algorithms.

关 键 词:大数据 频繁模式挖掘 位图计算 MAPREDUCE框架 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象