Lattice-Boltzmann方腔模型的CUDA加速实现  被引量:3

Implementation of Lattice Boltzmann Method for Cavity Flow Using CUDA

在线阅读下载全文

作  者:郑彦奎[1] 刘沙[2] 熊生伟[2] 周季夫[1] 

机构地区:[1]西北工业大学高性能计算研究与发展中心,西安710072 [2]西北工业大学叶栅空气动力学国防科技重点实验室,西安710072

出  处:《科学技术与工程》2010年第7期1684-1688,共5页Science Technology and Engineering

基  金:航空科学基金项目(20061453020);西北工业大学基础科学研究基金重点项目资助

摘  要:对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存存储数据,将模型中9个分布函数存储为二维网格,每个网格分配一个线程,每个线程块包括256个线程,多条线程并行计算。在普通个人计算机上,采用NVIDIA GeForce 9600 GT显卡和CUDA,实现了LBM模拟方腔流动,将计算速度提高到CPU的50倍。A new algorithm on the numerical simulation of Lattice-Boltzmann method (LBM) based on CUDA is studied. The method performs well for improving the computational efficiency on GPU and substantially reduces the time consumption of the calculation process. The driven cavity flow is simulated by the D2Q9 model of LBM method, with the non-equilibrium extrapolation method for velocity boundary to deal the wall boundary conditions and using global memory and texture memory to store data. In the model the 9 distribution functions were all stored in the form of two-dimensional grid, each grid is assigned a thread and each thread block includes 256 threads. The simulation for cavity flow with LBM was carried out by CUDA and NVIDIA GeForce 9600 GT on a PC. The final speed is 50 times faster than that of the CPU.

关 键 词:计算统一设备架构(Compute Unified Device Architoctune CUDA) GPU Lattice BOLTZMANN方法 非平衡外推 边界处理 纹理内存 多线程 并行计算 

分 类 号:TP391.9[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象