基于MapReduce的封闭立方体并行计算方法  被引量:8

A Parallel Closed-Cubing Algorithm Based on MapReduce

在线阅读下载全文

作  者:奚建清[1] 游进国[1] 汤德佑[1] 肖伟吉[1] 

机构地区:[1]华南理工大学计算机科学与工程学院,广东广州510006

出  处:《华南理工大学学报(自然科学版)》2009年第1期91-95,112,共6页Journal of South China University of Technology(Natural Science Edition)

基  金:广东省科技计划项目(2004A10205003;2006B11301001);广州市科技计划项目(2006Z3-D3081)

摘  要:封闭立方体是一种非常有效而重要的数据立方体压缩技术,目前还缺乏对其并行算法的研究.为此,文中提出一种采用C-Cubing方法并通过MapReduce并行模型进行并行化的新方法.该方法首先在Map过程中对各个数据分块计算出数据单元的代表元组和封闭掩码,然后在Reduce过程中进行聚合以获得封闭单元.实验结果表明,文中方法能有效地提高在大数据集上计算封闭立方体的速度.Although the closed cube is a high-efficiency and important technology for data cube compression, there is no research on its parallel algorithm at present. In this paper, a novel parallel approach combining the C-Cubing technology with the MapReduce framework is proposed. In this approach, the representative tuple and closed mask of each data cell for every data block are computed in the Map process, and the closed cells are obtained by the aggregation in the Reduce process. Experimental results show that the proposed approach greatly increases the computation speed of closed cubes in large-scale datasets.

关 键 词:数据仓库 联机分析处理 并行算法 封闭立方体 MapReduce技术 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象