检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陶宇炜[1] 谢爱娟[2] TAO Yuwei;XIE Aijuan(Office of IT Services and Big Data,Changzhou University,Changzhou 213164,China;School of Petrochemical Engineering,Changzhou University,Changzhou 213164,China)
机构地区:[1]常州大学信息化建设与大数据处,江苏常州213164 [2]常州大学石油化工学院,江苏常州213164
出 处:《常州大学学报(自然科学版)》2024年第5期61-70,共10页Journal of Changzhou University:Natural Science Edition
基 金:2021年江苏省教育科学"十四五"规划立项课题资助项目(D/2021/01/131);2021年常州大学石油化工学院教育教学研究课题资助项目(SHJY202101)。
摘 要:针对Spark可扩展分布式平台在作业任务调度时,没有考虑异构集群节点计算能力的差异和负载均衡问题,导致系统性能受到影响,文章构建了一种Spark环境下异构集群节点负载均衡调度策略。计算节点根据抽样算法,预测数据分布特征,将数据均衡划分为多个分区,根据异构集群节点静态负载和动态负载权重分配,获得异构集群节点实时负载,动态调度作业任务。最后,在异构集群上,通过Wordcount,TeraSort,K-means三种基准测试比较分析。实验结果表明,该算法运行时间明显减少,异构集群的性能得到提升。Aiming at the problem that the Spark scalable distributed platform does not consider the computing capabilities of heterogeneous cluster nodes and load balance during job task scheduling,which affects the system performance,this paper constructs heterogeneous cluster nodes load balance scheduling policy under the Spark environment.Heterogeneous cluster node predicts the data distribution characteristics according to the sampling algorithm,divides the data into balancing partitions.According to the static load and dynamic load weight distribution,heterogeneous cluster node obtains the real-time load,and dynamically schedules job tasks.Finally,Wordcount,TeraSort,and K-means three benchmark tests were used to compare and analyze during heterogeneous cluster operation.Experimental results show that this algorithm can reduce the execution time significantly,and improve the performance of heterogeneous cluster.
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.15.60.240