GPGPU

作品数:169被引量:389H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:马安国魏晓辉邢座程王志英徐新海更多>>
相关机构:山东浪潮科学研究院有限公司国防科学技术大学吉林大学长沙景美集成电路设计有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与科学x
条 记 录,以下是1-10
视图:
排序:
通过部分Warp重组消除GPGPU控制流的不一致性
《计算机工程与科学》2019年第8期1335-1342,共8页沈立 杨耀华 王志英 
国家自然科学基金(61472431)
GPU已被广泛应用于当前的高性能计算系统中,但其性能却受到程序运行时不同控制流方向的严重制约。这一问题通常通过动态Warp重组技术来解决,即将一个或多个Warp内沿相同控制流执行的线程组合在一起,构成一个新的Warp。但是,这类方法普...
关键词:GPGPU 控制流不一致 Warp重组 框架 
一种面向GPGPU的行为感知的存储调度策略被引量:1
《计算机工程与科学》2017年第6期1011-1021,共11页刘子骏 何炎祥 张军 李清安 沈凡凡 
国家自然科学基金(61373039;61170022)
随着通用图形处理器在高性能计算领域的广泛应用,新的并行执行模式被提出。在新模式下,当前的存储调度策略未能使存储器的吞吐率达到最大。分析了图形处理器上多程序并行执行模式下应用程序访存行为特征及其性能损失不公平的原因,提出...
关键词:GPGPU 并行执行 行为感知 存储调度 
GPGPU性能模型研究被引量:1
《计算机工程与科学》2013年第12期1-7,共7页王锋 杜云飞 陈娟 
国家863计划资助项目(2012AA010903);国家自然科学基金资助项目(61170049)
GPGPU的发展为并行程序带来了丰富的计算资源,但是对程序优化提出了更高的要求。程序性能模型对定位程序性能瓶颈,指导优化方法,平衡与其他设备的负载等方面起着重要作用。描述了当前性能模型的研究现状,并对其进行分类和分析。总体上...
关键词:GPGPU GPU 性能模型 
三维Navier-Stokes方程分步法的并行算法在异构平台上实现初探被引量:1
《计算机工程与科学》2012年第9期33-39,共7页徐莹 徐磊 姜恺 
国家863计划资助项目(2012AA01A308);自然科学基金青年基金资助项目(10902063)
本文选取了三维不可压缩流动方程的分步法(fractional-step method),其中动量方程使用BiCGSTAB算法进行迭代求解,而压力泊松方程使用Fourier变换法进行直接求解。本文研究该算法在集群平台上的并行算法,从区域分解入手,分析一维、两维...
关键词:异构平台 GPGPU 并行算法 不可压缩Navier—Stokes方程 分步法 
三维Navier-Stokes方程的差分-谱方法混合法在GPU上的实现与优化
《计算机工程与科学》2012年第8期53-58,共6页徐莹 徐磊 
国家863计划资助项目(2012AA01A308);自然科学基金青年基金资助项目(10902063)
差分-谱方法通常在槽道湍流的直接数值模拟中使用,本文主要研究差分-谱方法在单GPU卡上的实现。由于GPU的硬件发展十分迅速,不同的GPU硬件对双精度计算的支持有所不同,本文首先验证GPU上数值计算的精度,用差分-谱混合法求解标量扩散方程...
关键词:异构平台 GPGPU 并行算法 不可压缩NAVIER-STOKES方程 差分-谱方法混合法 
GPGPU技术研究与发展被引量:4
《计算机工程与科学》2011年第10期85-92,共8页林一松 唐玉华 唐滔 
国家自然科学基金资助项目(60621003;60873016)
半导体工艺的发展使得芯片上集成的晶体管数目不断增加,图形处理器的存储和计算能力也越来越强大。目前,GPU的峰值运算能力已经远远超出主流的CPU,它在非图形计算领域,特别是高性能计算领域的潜力已经引起越来越多研究者的关注。本文介...
关键词:GPGPU 体系结构 编程模型 
基于满二叉树分块策略的大规模数据场纹理映射体绘制算法被引量:1
《计算机工程与科学》2011年第3期57-61,共5页孙安玉 江贵平 
国家自然科学基金资助项目(30970866)
针对纹理映射体绘制物理内存空间的限制,本文提出一种可在通用图形硬件上完成大规模数据场实时体绘制的有效方法。该方法基于满二叉树纹理分块策略,利用GPU着色器可编程性,将纹理数据制作为一个一维传递函数查找表和一个规模等同于体数...
关键词:满二叉树 纹理分块 体绘制 三维纹理映射 GPGPU 
基于GPU加速的多物体碰撞检测方法被引量:5
《计算机工程与科学》2009年第12期52-55,共4页王磊 王毅刚 
国家自然科学基金资助项目(60503056);浙江省科技厅科技计划资助项目(2008C24014)
为了在虚拟环境中更加真实地模拟现实环境中物体的运动,需要在仿真系统中加入碰撞检测模块。现有的碰撞检测算法虽然能够快速检测两个物体是否相交,但在物体数量非常多的场景中,因需要对物体两两进行判断,所以仍无法达到较高的检测速度...
关键词:碰撞检测 GPGPU 方向包围盒 
使用GPU加速BLAST算法初探被引量:3
《计算机工程与科学》2009年第11期98-101,共4页万宁 谢海波 张清 赵开勇 褚晓文 于军 
国家973计划资助项目(2006CB910400);中国科学院重大科研装备研制项目(YZ200823)
应用GPU通用高性能编程技术实现了一种加速BLAST算法的新方法。BLAST是目前最常用的用于生物序列查询比对的算法和软件包,其处理速度受到串行化执行和磁盘I/O等因素的影响。本文通过实验分析了BLAST软件包中的典型程序BLASTN的运行热点...
关键词:BLAST BLASTN 序列查询比对 GPU GPGPU CUDA 并行计算 
基于CUDA平台的遗传算法并行实现研究被引量:10
《计算机工程与科学》2009年第A01期68-72,共5页谭彩凤 马安国 邢座程 
国家自然科学基金资助项目(60873016);国家863计划资助项目(2009AA01Z102)
CUDA技术方便程序员在GPU上进行通用计算,但并没有提供随机数产生的应用接口。为此,本文提出并实现在CUDA开发平台上并行产生均匀随机数算法,测试证明算法可行。在此基础上优化基本遗传算法,并在GPU上并行实现其所有操作,提高其运行速...
关键词:随机数 遗传算法 并行计算 GPGPU CUDA GPU 
检索报告 对象比较 聚类工具 使用帮助 返回顶部