检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郑彦奎[1] 刘沙[2] 熊生伟[2] 周季夫[1]
机构地区:[1]西北工业大学高性能计算研究与发展中心,西安710072 [2]西北工业大学叶栅空气动力学国防科技重点实验室,西安710072
出 处:《科学技术与工程》2010年第7期1684-1688,共5页Science Technology and Engineering
基 金:航空科学基金项目(20061453020);西北工业大学基础科学研究基金重点项目资助
摘 要:对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存存储数据,将模型中9个分布函数存储为二维网格,每个网格分配一个线程,每个线程块包括256个线程,多条线程并行计算。在普通个人计算机上,采用NVIDIA GeForce 9600 GT显卡和CUDA,实现了LBM模拟方腔流动,将计算速度提高到CPU的50倍。A new algorithm on the numerical simulation of Lattice-Boltzmann method (LBM) based on CUDA is studied. The method performs well for improving the computational efficiency on GPU and substantially reduces the time consumption of the calculation process. The driven cavity flow is simulated by the D2Q9 model of LBM method, with the non-equilibrium extrapolation method for velocity boundary to deal the wall boundary conditions and using global memory and texture memory to store data. In the model the 9 distribution functions were all stored in the form of two-dimensional grid, each grid is assigned a thread and each thread block includes 256 threads. The simulation for cavity flow with LBM was carried out by CUDA and NVIDIA GeForce 9600 GT on a PC. The final speed is 50 times faster than that of the CPU.
关 键 词:计算统一设备架构(Compute Unified Device Architoctune CUDA) GPU Lattice BOLTZMANN方法 非平衡外推 边界处理 纹理内存 多线程 并行计算
分 类 号:TP391.9[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117