检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院软件研究所并行软件与计算科学实验室,北京100190 [2]中国科学院软件研究所计算机科学国家重点实验室,北京100190 [3]中国科学院研究生院,北京100039
出 处:《数值计算与计算机应用》2010年第2期123-130,共8页Journal on Numerical Methods and Computer Applications
基 金:国家自然科学基金(No.60303020);国家自然基金重点项目(No.60533020);国家863项目(No.2006AA01A125;No.2009AA01A134;No.2009AA01A129)的部分资助
摘 要:本文给出了一类基于六边形非张量积区域上的广义离散快速傅立叶变换算法(HFFT)以及它在国产百万亿次超级计算机(曙光5000A)上的测试运行情况.文章介绍了该算法在曙光5000A上的大规模集群测试加速比和可扩展性特性,并通过分析,说明HFFT在国产超级计算机的大规模并行环境下拥有良好的可扩展性.在使用8192个处理器核的情况下,HFFT加速比达到了277倍.我们同样对FFTW软件包进行了测试.本文的分析为解决其他科学计算程序在国产百万亿次规模集群上的可扩展性问题,提供了一些先行的参考和建议.In this article we propose a set of fast algorithms for computing the HFFT (Hi-dimensional Fast discrete generalized Fourier Transforms) over the hexagon domains and the parallel dodecahedron domains. We evaluate the performance characteristic of HFFT on domestic 100Tera-Scale cluster (The Dawning 5000A Supercomputer). The evaluation result indicates that HFFT algorithm scales well on Dawning 5000A. As using 8192 cores in the cluster, the speedup of HFFT is about 277. By using a specific recursive data structure, the scalability of the HFFT program is promising in this evaluation. We also evaluated the FFTW on the Dawning 5000A. The analysis in this article provides some useful advice and suggestions on the scalability of other scientific applications on the domestic 100Tera-Scale Supercomputer.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222