检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈辉[1]
机构地区:[1]江西财经大学软件与通信工程学院,南昌330012
出 处:《小型微型计算机系统》2014年第7期1599-1603,共5页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(61262033;61262009;61363075)资助;江西省教育厅科技项目(GJJ13303)资助
摘 要:设计了一种基于MapReduce框架并行挖掘大数据频繁模式的算法,算法首先研究了运用位图计算发现数据集频繁模式的方法;并对传统MapReduce框架进行扩展,增加了位图计算和不重要模式剪枝等计算功能;为了提高大数据模式挖掘的性能,还设计模式剪枝算法来识别并删除数据集中的不重要模式.最后,实验结果表明,该算法具有很强的可扩展性,并优于其它同类算法.This paper proposed a parallel algorithm of mining frequent patterns in big data using extended MapReduce. First,we analyze the frequent pattern mining method using bitmap computation by scanning the dataset only once. Secondly,we extended the traditional MapReduce frame by adding the bitmap computation and frequent mining function. In order to improve the performance of mining big data,an algorithm of pruning insignificant patterns in dataset is also presented. Finally,the experimental results show that the proposed method is efficient,strong in scalability,and prior to analogous algorithms.
关 键 词:大数据 频繁模式挖掘 位图计算 MAPREDUCE框架
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249