数据密集型计算中负载均衡的数据布局方法  被引量:6

Load-Balanced Data Layout Approach in Data-Intensive Computing

在线阅读下载全文

作  者:宋杰[1] 李甜甜[1] 闫振兴[1] 朱志良[1] 

机构地区:[1]东北大学软件学院,沈阳110819

出  处:《北京邮电大学学报》2013年第4期76-80,共5页Journal of Beijing University of Posts and Telecommunications

基  金:国家自然科学基金项目(61202088);辽宁省自然科学基金项目(200102059);中央高校基本科研业务费专项资金项目(N110417002)

摘  要:广泛用于数据密集型计算的MapReduce模型将计算部署到数据端并行执行,数据布局将不再只影响存储本身,还影响计算效率;节点上存储数据的特征决定该节点上任务的执行效率,负载均衡从传统的服务器管理或任务调度研究转变成为以提高并行性为目的的数据布局研究,为此,分析了数据密集型计算和MapReduce环境中数据布局的特点,提出了负载均衡的数据布局目标,并提出在特定环境下实现负载均衡的数据布局方法,最后通过实验证明了数据布局目标和数据布局方法的有效性.理论和实验结果证明,新提出的布局方法能有效地提高MapReduce应用的并行性,优化其执行效率.Widely used in data-intensive computing, the MapReduce model deploys computing to the da- ta side so as to execute in parallel. On this occasion, data layout will not only affect the storage itself, but also affect the computing efficiency. Computing efficiency of node is determined by features of data stored on this node. Therefore, the study on load balancing is accordingly shifted from traditional server management or task scheduling to study of data layout as a purpose to improve parallelism. The data lay- out characteristics in data-intensive computing and MapReduee environment is analyzed, a load-balanced goal of data layout is proposed, and a load-balanced data layout approach in a specific environment is presented as well. The proposed data layout goal and approach are proved effective through experiments. It is shown that the proposed data layout approach can effectively improve the parallelism of MapReduee applications, thus optimizing the computing efficiency.

关 键 词:数据密集型计算 数据布局 负载均衡 MapRedcue 云计算 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象