基于递归随机抽样的Hadoop配置优化  被引量:1

Configuration Optimization of Hadoop Based on Recursive Random Sampling

在线阅读下载全文

作  者:祝春祥 陈世平[1] 陈敏刚[2] 

机构地区:[1]上海理工大学光电信息与计算机工程学院,上海200093 [2]上海市计算机软件评测重点实验室,上海201112

出  处:《计算机工程》2016年第2期26-32,共7页Computer Engineering

基  金:国家自然科学基金资助项目(61472256;61170277);上海市教委科研创新基金资助重点项目(12zz137);上海市科委科技创新基金资助项目(13511505303);上海市一流学科建设基金资助项目(S1201YLSK)

摘  要:Hadoop平台目前有近200个配置参数,对这些参数进行合理配置能提高系统性能。针对Hadoop参数配置的优化问题,提出一种基于递归随机抽样的黑盒优化策略。利用随机抽样的初始高效性,通过不断调整样本空间进行递归随机抽样,从而快速搜索到近似的全局最优配置。实验结果表明,与传统配置方法相比,应用黑盒优化策略的配置方法可提高14%-25%的Hadoop作业处理速度,且具有较好的稳定性和可靠性。Hadoop platform has over 200 configuration parameters,it can improve the performance of the system by deploying these parameters in reason. Aiming at the optimization of Hadoop configuration parameters problem,a black box optimization strategy based on recursive random sampling is proposed. It utilizes the initial high efficiency of random sampling,constantly adjusts the sample space to start recursive random sampling,and searches the approximate global optimal configuration quickly and efficiently. Experimental results show that,the configuration method based on black box optimization strategy can improve the job processing speed by 14% - 25% than traditional method,and it has good stability and reliability.

关 键 词:HADOOP平台 黑盒优化 粒子群算法 模拟退火算法 递归随机抽样 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象