检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郑芳[1,2] 许先斌[1,3] 向冬冬[1] 王卓薇[1] 徐鸣[1]
机构地区:[1]武汉大学计算机学院,武汉430072 [2]华中农业大学理学院,武汉430070 [3]武汉东湖学院计算机科学学院,武汉430212
出 处:《计算机科学》2012年第B06期370-374,共5页Computer Science
基 金:中央高校基本科研业务费专项资金(3101012);高可信软件技术教育部重点实验室开放课题(HCST201104)资助
摘 要:GRAPES(Global and Regional Assimilation and Prediction System)是由中国气象科学研究院自主研究开发的中国新一代数值天气预报系统,由于其处理的数据量非常庞大以及对实时性的要求较高,因此一直是并行计算领域研究的热点。首次运用GPU(图形处理器)通用计算及CUDA技术对GRAPES_Meso模式中物理过程的RRTM(快速辐射传输模式)长波辐射模块进行并行化处理。在性能分析的基础上,针对GPU体系结构的特点,从代码优化、存储器优化、编译选项等方面对程序性能进行优化,并取得了14X倍的加速比。经过测试表明,长波辐射RRTM模块在GPU上并行计算过程正确、稳定而且有效,并为GRAPES系统未来在GPU平台上的并行化发展奠定了一定的基础。GRAPES(Global and Regional Assimilation and Prediction System) is a new generation of numerical weather prediction(NWP) system of China.As the system processes amount of data and requires high real-time,it is always a hot research field of parallel computing.This is the first time that we use GPU(Graphics Processor Unit) general-purpose computing and CUDA technology on RRTM(Rapid Radiative transfer model) long-wave radiation module of GRAPES_Meso model for parallel processing.Based on the analysis of computing performance,and according to the characteristics of the GPU architecture,the RRTM module parallel computational efficiency was optimized from the aspect of code tuning,memory,compiler options and etc.The optimization results indicate that the performance obtains a speedup of 14.3×.Experiments were carried out on the GPU platform.The results show that the parallel computing algorithm is correct,stable and efficient for operational implementation of GRAPES in near future.
关 键 词:GPU CUDA GRAPES系统 RRTM 并行计算
分 类 号:TP399[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3