神威·太湖之光平台上宇宙N体模拟中FMM的并行优化  

Parallel optimization of FMM for cosmic N-body simulations on Sunway TaihuLight platform

在线阅读下载全文

作  者:韩承磊 梁建国 傅游 叶雨曦 花嵘 李倩倩 HAN Chenglei;LIANG Jianguo;FU You;YE Yuxi;HUA Rong;LI Qianqian(College of Computer Science and Technology,Shandong University of Science and Technology,Qingdao 266590,China;College of Computer,Qufu Normal University,Rizhao 273165,China)

机构地区:[1]山东科技大学计算机科学与工程学院,山东青岛266590 [2]曲阜师范大学计算机学院,山东日照273165

出  处:《山东科技大学学报(自然科学版)》2024年第3期105-113,共9页Journal of Shandong University of Science and Technology(Natural Science)

基  金:山东省自然科学基金项目(ZR2022MF274,ZR2021LZH004,ZR2023LZH009)。

摘  要:宇宙学模拟是典型的N体问题,是高性能计算中具有代表性和挑战性的问题之一。本研究在神威·太湖之光平台上对天文N体模拟软件PhotoNs-2中的计算主体——快速多极子方法(fast multipole method,FMM)进行移植和性能优化。针对目前研究中存在的计算效率不高、通信开销大问题,结合神威·太湖之光SW26010处理器架构特点,通过数据重整、超越函数计算重构、设计双缓冲和消息传递接口通信时合并发送树进行优化。相较于优化前,优化后的PhotoNs-2在3个不同算例规模下均取得约24倍的加速效果。提出的优化方案可以为其他高性能应用在神威·太湖之光平台上的移植与优化提供参考。Cosmological simulation is a typical N-body problem and one of the representative and challenging problems in high-performance computing.This paper ports and optimizes the performance of the fast multipole method(FMM),the main part of the astronomical N-body simulation software PhotoNs-2 on the Sunway TaihuLight platform.Aiming to increase the computational efficiency and reduce the communication expense in the current research,this paper optimizes the fast multipole method by reorganizing data,reconstructing the transcendental function computation and designing double buffering and merging the sending tree during message passing interface(MPI)communication based on the characteristics of the architecture of the SW26010 processor of Sunway TaihuLight.Compared with the algorithm before opitimization,the optimized PhotoNs-2 achieves a speedup of about 24 times under three different arithmetic cases.The proposed optimization scheme can provide a reference for the porting and optimization of other high-performance applications on the Sunway TaihuLight platform.

关 键 词:神威·太湖之光平台 并行优化 数据重整 快速多极子方法 宇宙N体 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象