基于Kokkos框架的CFD求解器性能可移植性分析  

Performance Portability Analysis of CFD Solver Based on Kokkos

在线阅读下载全文

作  者:王辰[1] 陈龙[1] WANG Chen;CHEN Long(College of Aerospace Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)

机构地区:[1]南京航空航天大学航空学院,南京210016

出  处:《计算机系统应用》2025年第4期248-255,共8页Computer Systems & Applications

基  金:国家自然科学基金委员会联合基金(U20A2070);江苏省高校优势学科建设工程。

摘  要:为提高计算流体力学的求解速度,一般采用并行执行的方法,然而由于计算硬件架构和编程语言的多样性,对程序的可移植性带来了挑战.为此本文使用Kokkos框架实现了计算流体力学求解器的异构并行计算,并且使用规约法、原子操作和染色法来处理并行计算过程中的数据冲突问题,提出了基于此框架下的异构并行计算的数据冲突的算法实现方案.针对图形处理器的架构特点,分析了不同硬件上单精度和双精度计算的加速比,得出了不同计算硬件上的最优并行策略.研究证明使用原子操作单精度计算对于使用图形处理器加速流体力学计算而言,能够极大地提升求解效率.To accelerate the solution of computational fluid dynamics(CFD),parallel execution is commonly used.However,the diversity of computing hardware architectures and programming languages poses challenges to program portability.In this study,the Kokkos framework is used to implement heterogeneous parallel CFD computing.Moreover,the reduction method,atomic operations,and the coloring approach are employed to address data conflicts in the process of parallel computing.A specific algorithmic solution for data conflict in heterogeneous parallel computing under this framework is proposed.Given the architectural characteristics of the graphics processing unit(GPU),the speedup ratios of single-precision and double-precision calculations on different hardware are analyzed,and optimal parallel strategies on different computing hardware are obtained.The study demonstrates that using atomic operations for single-precision computations on GPUs significantly enhances CFD solving efficiency.

关 键 词:异构计算 计算流体力学 Kokkos 非结构网格 有限体积法 

分 类 号:TP391.9[自动化与计算机技术—计算机应用技术] TP391.41[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象