-

检索结果分析

结果分析中...
检索条件:"关键词=统一计算架构 "
条 记 录,以下是1-10
视图:
排序:
显示条数:
一种基于OPENACC的GPU加速实现高斯模糊算法被引量:7
计算机技术与发展》2013年第7期147-150,共4页曾文权 胡玉贵 何拥军 林敏 
广东省自然科学基金(S2011010002537);广东省科技计划项目(2012A030400029)
针对使用底层API进行GPU加速时存在的编码复杂以及效率低下等缺陷,文中试图利用基于中间层的OPENACC加速技术对传统的串行代码进行改写,从而达到改善开发效率,简化代码之目的。文中以传统的串行高斯模糊算法为处理对象,在其中添加OPENAC...
关键词:OPENACC 图形处理器 统一计算架构 高斯模糊 
基于CTR模式的GPU并行AES算法的研究与实现被引量:8
《小型微型计算机系统》2015年第3期529-533,共5页费雄伟 李肯立 阳王东 
国家自然科学基金重点项目(61133005)资助;国家自然科学基金项目(90715029;61070057;60603053)资助;益阳市科技计划项目(2014JZ37)资助
为了对任意长的明/密文进行并行加密/解密,在分析了AES(Advanced Encryption Standard)的多种模式后,采用了最合适的CTR(Counter)模式设计和实现了GPU(Graphics Processing Unit)并行AES算法,并进行了优化.针对Nvidia Geforce GTX460平...
关键词:计数器模式 GPU并行 时间复杂度 加速比 统一计算架构 
用GPU加速信号形状与探测器分辨率随能量变化的卷积计算
《核技术》2018年第8期48-53,共6页乔颢 王思广 
国家自然科学基金面上项目(No.10979010);中国科技部重点研发计划项目(No.2016YFA0400300)资助~~
在形如中微子能谱分析中,因其本征能谱跨度较大,在积分描述所探测到的能谱时,探测器分辨率本身随能量的连续变化应该被考虑。对于该类能谱的拟合分析,传统的单靠中央处理器(Central Processing Unit,CPU)无法保障时间要求。本文利用图...
关键词:图形处理器 卷积 数值积分 RooFit 统一计算架构 
GPU下的二叉树定价模型
《华中科技大学学报(自然科学版)》2011年第S1期102-105,共4页桂叶晨 刘涛 彭蓉 文高进 
国家高技术研究发展计划资助项目(2006AA01A114;2007AA120502);深圳市科技计划资助项目(SY200806300211A)
针对二叉树定价模型算法计算量大、耗时长的问题,利用CUDA架构对该模型进行了并行改造,在GPU上对该算法进行了加速测试与相应的性能分析.实验结果表明:在单个GTX295节点上,对于数据规模为16K的期权,GPU相对于其4核Xeon E5520的加速比已...
关键词:二叉树模型 期权定价 统一计算架构 图形处理单元 加速比 
协同CPU和GPU的核密度估计及其可视化算法
《地理空间信息》2024年第6期29-33,47,共6页胡森 高苏 蔡忠亮 
国家重点研发计划资助项目(2021YFB2501101)。
大数据时代背景下,空间数据点规模越来越大,图像分辨率越来越高,使用CPU计算核密度估计结果并对其可视化的效率越来越低,难以满足应用对实时性的需求。针对该问题,提出了一种协同CPU和GPU的核密度估计及其可视化算法,该算法结合CPU的控...
关键词:核密度估计 可视化 GPU OPENGL 统一计算架构 
大规模MIMO中基于低复杂度雅克比预编码算法及实现被引量:1
计算机应用与软件》2017年第10期294-297,共4页王雷 
迫零线性预编码可以获得接近最优的系统容量,不同于传统MIMO系统,大规模MIMO将会配置成百根天线,随着天线数量增加,使得迫零线性预编码矩阵求逆计算复杂,不利于在应用中实现。为了减小线性预编码计算复杂度,提出基于低复杂度的雅克比迭...
关键词:预编码 雅克比 统一计算架构 迫零 异构多核 
基于统一计算架构的人体受照剂量实时仿真评估方法
《辐射研究与辐射工艺学报》2015年第6期41-47,共7页杨子辉 王静 何桃 宋婧 龙鹏程 
中国科学院战略性先导科技专项(XDA03040000);国家ITER973计划(2014GB1120000);国家自然科学基金(No.11305205)资助~~
基于统一计算架构(Compute unified device architecture,CUDA),利用GPU的流多处理器和共享显存实现了辐射环境中人体体素级受照剂量的并行计算。通过加速器驱动次临界系统散裂靶质子束窗的维修更换仿真例题的测试,百万量级体素人体受...
关键词:受照剂量评估 并行计算 统一计算架构 实时仿真 
基于CUDA的高速FFT计算被引量:22
计算机应用研究》2011年第4期1556-1559,共4页赵丽丽 张盛兵 张萌 姚涛 
国家"863"计划资助项目(2009AA01Z110);西北工业大学研究生创新资助项目(09024)
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明...
关键词:图形处理器 统一计算架构 映射策略 存储层次 
多GPU节点下的NAMD测试与分析
《华中科技大学学报(自然科学版)》2011年第S1期106-109,共4页桂叶晨 刘涛 彭蓉 文高进 
国家高技术研究发展计划资助项目(2006AA01A114;2007AA120502);深圳市科技计划资助项目(SY200806300211A)
运用大规模分子动力学并行开源代码NAMD测试了深腾7000GGPU集群的性能.在配备有Teslac1060与双路4核CPU的节点上,分别对烟草花病毒(STMV),血脂蛋白(ApoA1)与Tiny这3类分子进行了单节点与多节点的测试.测试结果表明:GPU相较于CPU能获得平...
关键词:纳米分子动力学 统一计算架构 图形处理单元 并行计算 非成键作用力 
快速不变矩算法基于CUDA的并行实现
计算机应用》2010年第7期1983-1986,共4页韩斌 孙文赟 周飞 王士同 
不变矩自提出以来被广泛应用于目标识别系统中进行特征描述,这需要能够实时计算不变矩值。虽然已经提出了许多不变矩的快速算法,但仍无法在单台PC机上实现不变矩的实时计算。分析了基于差分矩因子的不变矩快速算法的并行性,提出了一种...
关键词:不变矩 并行计算 统一计算架构 协同计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部