最小化多MapReduce任务总完工时间的分析模型及其应用  

An analytical model and its applications for minimizing total makespan of multiple MapReduce jobs

在线阅读下载全文

作  者:田文洪[1,2] 陈瑜[2] 王心阳 薛瑞尼[2] 赵勇[2] 

机构地区:[1]电子科技大学信息与软件工程学院,四川成都610054 [2]电子科技大学计算机科学与工程学院,四川成都611731

出  处:《计算机工程与科学》2014年第4期571-578,共8页Computer Engineering & Science

基  金:国家自然科学基金资助项目(61150110486;61272528);中央高校基金资助项目(ID-ZYGX2013J073);2013年CCF-腾讯科研基金资助项目

摘  要:随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发现多个任务的总完工时间和任务的执行顺序有密切关系。研究目标是设计作业调度系统分析模型,最小化一批MapReduce作业的总完工时间。提出一个更好的调度策略和实现方法,使整个调度系统符合经典Johnson算法的条件,从而可使用经典Johnson算法在线性时间内获取总完工时间的最优解。同时,针对需要使用两个或多个资源池进行平衡的问题,提出了一种线性时间解决方案,优于已知的近似模拟方案。该理论模型可应用于提高系统响应速度、节能和负载均衡等方面,对应的应用实例提供了证实。As large-scale MapReduce clusters become widely adapted to process huge amount of data, one of critical challenges is to improve the service quality of MapReduce clusters by minimizing their makespan. A scheduling model can be considered for multiple MapReduce jobs. It is observed that the order in which these jobs are executed can have a significant impact on their overall makespan. The goal of the paper is to design a framework of automatic job scheduler and propose an analytical model for minimizing the makespan of such a set of MapReduce jobs. By considering a better strategy and implementa- tion, we can meet the conditions of the classical Johnson algorithm and use it to find the optimal solu- tion. Under our proposed new strategy, solving the balanced pools problem becomes exact in linear time, better than existing simulating approaches. Our proposed analytical results can be applied to improve system response time, energy-efficiency and load-balance in Hadoop cluster pools, while corresponding numerical examples validate our observations.

关 键 词:HADOOP MAPREDUCE 批量作业 调度优化 最小化总完工时间 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象