基于计算缓存方法的分子动力学程序性能优化  被引量:3

Performance Optimization of a Molecular Dynamics Code Based on Computational Caching

在线阅读下载全文

作  者:张宝印[1] 莫则尧[1] 曹小林[1] 

机构地区:[1]北京应用物理与计算数学研究所,北京100094

出  处:《计算机工程与科学》2009年第11期77-79,83,共4页Computer Engineering & Science

基  金:国家自然科学基金资助项目(60873005;60603052)

摘  要:分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,我们发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此我们应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3%。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27%。The codes of molecular dynamics always run in a low performance manner, and achieve only several percents of the peak performance on modern supercomputers. In this paper, we optimize the program PMD3D on the Shenteng 6800 supercomputer. By performance analysis, we obtain that the dependence of the long-latency operations heavily influences the parallel efficiency of instructions. Based on the analysis, we optimize the codes, cache the amount irregular computations, and compute them vectorially. We achieve 32. 3% of the peak performance and 4×speedups on the Itanium 2 processor. Fi- nally, we test the program on the Shenteng 6800 with 256 CPUs in 64 nodes, and achieve 27% of the peak performance 1. 3TFlops.

关 键 词:分子动力学 性能优化 计算缓存 指令级并行 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象