检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈道琨 刘芳芳[2,3] 杨超 Chen Daokun;Liu Fangfang;Yang Chao(University of Chinese Academy of Sciences,Beijing 100049,China;Laboratory of Parallel Software and Computational Science,ISCAS,Beijing 100190,China;State Key Laboratory of Computer Science,ISCAS,Beijing 100190,China;School of Mathematical Sciences,Peking University,Beijing 100871,China)
机构地区:[1]中国科学院大学,北京100049 [2]中国科学院软件研究所并行软件与计算科学实验室,北京100190 [3]中国科学院软件研究所计算机科学国家重点实验室,北京100190 [4]北京大学数学科学学院,北京100871
出 处:《数值计算与计算机应用》2023年第2期198-213,共16页Journal on Numerical Methods and Computer Applications
基 金:国家重点研发计划高性能计算重点专项(2020YFB0204601)资助。
摘 要:大气动力学问题的数值模拟在气象预报等领域具有广泛的应用.相关数值模拟依赖超级计算机平台实现高精度高分辨率的气象预报,隐式求解不受稳定性条件限制,相比显式求解更有优势.面向新的超级计算机架构特征研究隐式大气动力学问题中一系列算子操作的并行和优化方法是非常有必要的.本文在规则递推关系的理论框架下对大气动力学问题预条件阶段的稀疏三角回代求解以及ILU矩阵分解操作的特征进行了总结,并结合申威26010Pro处理器的架构特点,对现有结构化稀疏三角线性方程组问题的并行算法进行了推广,设计了一套面向单向规则递推关系的算法框架,解决了预条件阶段各类算子的并行加速问题.本文还面向申威26010Pro处理器对大气动力学问题的模板计算等算子进行了移植和优化.实验结果显示,本文的算法框架对预条件阶段的算子能够实现26-33倍不等的加速效果,对模板计算等算子的优化相比串行计算有10-152倍的加速比.在新的神威超级计算机上最大测试到1700多万核心,浮点性能达到20.5PFlop/s.在大规模测试条件下的强(弱)可扩展性维持在56.81%(41.87%)以上.Numerical simulation of atmospheric model has been widely applied to weather prediction.Supercomputers play an important role in improving the accuracy and resolution of weather forecasting.Implicit solver of atmospheric model counts on many computation kernels.Their parallelization and optimization are critical to solver performance.Based on uniform recurrence relation(URR),this paper introduces a general framework to model the behavior of sparse triangular solve(SpTRSV)and incomplete matrix factorization(ILU).For SpTRSV and ILU,the extended framework leads to an speed up of 26×and 33×.This paper also parallelizes kernel functions in numerical simulation of atmospheric model,with acceleration ratio of 10-152×over serial implementations.The simulation achieves a sustained aggregated performance of 20.5PFlop/s in double precision,with strong-and weak-scaling efficiency above 56.81%and 41.87%,respectively.
关 键 词:大气动力学数值模拟 规则递推关系 异构并行计算 申威26010Pro处理器 结构化问题
分 类 号:P433[天文地球—大气科学及气象学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49