基于MapReduce的关系型数据仓库并行查询  被引量:9

Parallel Query for a Data Warehouse Utilizing MapReduce

在线阅读下载全文

作  者:师金钢[1] 鲍玉斌[1] 冷芳玲[1] 于戈[1] 

机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110819

出  处:《东北大学学报(自然科学版)》2011年第5期626-629,共4页Journal of Northeastern University(Natural Science)

基  金:国家自然科学基金资助项目(60773222)

摘  要:针对MapReduce框架与传统关系型数据库兼容性不好的问题,提出了一种基于分块结构的分布式关系数据库ChunkDB.并对MapReduce架构进行了扩展设计,使ChunkDB与MapReduce有效结合,将MapReduce的扩展性、易操作性、高并行性与关系数据库的索引等查询优化优势相结合.实验证明基于MapReduce的ChunkDB数据库能够为数据仓库应用提供快速高效的并行查询.MapReduce is a highly efficient distributed and parallel computing framework,allowing users to readily manage large clusters in parallel computing.But the MapReduce framework is not compatible with traditional relational databases.This paper proposes a distributed relational database ChunkDB based on the chunk structure,and extends and redesigns the MapReduce framework to ensure compatibility with the ChunkDB database.Thus,scalability,ease of operation,the high parallelism of MapReduce were integrated with the advantages,including indexing,query optimization of a relational database.The ChunkDB database based on MapReduce provided fast and efficient parallel query for data warehouse applications.

关 键 词:MAPREDUCE 数据仓库 并行计算 分布式数据库 查询优化 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象