一种有效的 Hadoop 参数优化模型  

AN EFFICIENT PARAMETER OPTIMIZATION STRATEGY OF HADOOP

在线阅读下载全文

作  者:杜丛强 邵增珍[1,2] 

机构地区:[1]山东师范大学信息科学与工程学院,济南250014 [2]山东省物流优化与预测工程技术研究中心,济南250014

出  处:《山东师范大学学报(自然科学版)》2016年第1期31-36,共6页Journal of Shandong Normal University(Natural Science)

基  金:国家自然科学基金资助项目(61272094);山东省科技发展计划项目(2014GGH201022,2011YD01099)

摘  要:为了使 Hadoop 集群能够应对复杂多变的作业,减少作业类型差异对集群性能所带来的影响,提出了一种参数优化模型实现对集群参数的自动调优配置。参数优化模型会根据作业类型及输入数据的规模选取相应的参数组合进行自动优化,然后通过改进的和声算法迭代产生最优的参数配置。实验结果表明,参数优化模型的自动调优保证了集群工作性能的充分发挥,有效的缩短了集群执行作业的运行时间,使集群具有良好的稳定性和扩展性。In order to make the Hadoop cluster to cope with the complex jobs,reduce the impact of cluster performance caused by job type differences,this paper proposes a parameter optimization model to automatically tune the configuration of cluster parameters. The parameter optimization model is based on job types and the size of the input data to select the corresponding parameter combination to automatically optimize,and then generate the optimal parameter configuration through the improved harmony algorithm. Experiment results show that the automatic tuning of parameter optimization model guarantees full play to the cluster performance,shortens the working time of cluster tasks effectively,and makes the cluster has a good stability and scalability.

关 键 词:HADOOP 集群 参数优化 智能算法 AT 服务器 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象