计算统一设备架构

作品数:106被引量:322H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:吴先良李立新叶剑杜晓刚孙冬更多>>
相关机构:中国科学院中国科学院研究生院中国科学院大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
高分辨率大气谱线并行计算方法研究被引量:1
《光学学报》2024年第18期264-272,共9页马志昂 李大成 吴军 程晨 
国家自然科学基金青年基金(42105082);高分专项(52-L10D01-0613-20/22)。
大气谱线计算是大气辐射传输中的一个重要环节,其计算速度慢是长期以来限制大气辐射传输计算效率的主要问题之一。通过对大气透过率中谱线计算可并行性的分析,利用图形处理器(GPU)构建了基于GPU并行处理的大气谱线计算模型。针对大气环...
关键词:光学计算 并行处理 逐线积分法 计算统一设备架构 相关K分布 
基于图形处理器的水下目标传递函数多频点处理方法
《舰船科学技术》2024年第14期153-157,共5页钱浩然 王斌 
三亚崖州湾科技城科技专项资助项目(SKJC-2022-PTDX-020)。
为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽...
关键词:板块元方法 图像处理器 计算统一设备架构 并行计算 
面阵数字航测影像快速辐射校正方法与实现
《测绘标准化》2024年第2期60-65,共6页马远征 王爽 马小芳 刘璐 窦关新 范谦绵 
随着计算机软硬件的发展,特别是可编程图形处理单元(GPU)框架计算统一设备架构(CUDA)的不断进步,使得利用CUDA开发影像快速处理应用的需求大幅增加。本文在分析国产大面阵航测相机DMZⅡ辐射特性的基础上,提出了基于C UDA的面阵数字航测...
关键词:辐射校正 数字航测相机 面阵影像 计算统一设备架构 归一化方法 
基于CUDA的并行雷达拼图算法研究被引量:3
《气象》2023年第10期1246-1253,共8页韩丰 高嵩 薛峰 李月安 
国家重点研发计划(2022YFC3002904);国家气象中心气象现代化专项(QXXDH202231);中国气象局重点创新团队(CMA2022ZD07)共同资助。
雷达组网拼图算法是强对流天气短时临近预报系统(Severe Weather Automatic Nowcasting,SWAN)的重要基础方法之一。提高拼图算法的效率,不仅可以提升现有SWAN临近算法序列的时效性,也能更好地应用高分辨率雷达数据,具有重要的实际意义...
关键词:组网拼图 GPU并行 计算统一设备架构(CUDA) 强对流天气短时临近预报系统(SWAN) 
基于GPU的低密度奇偶校验码译码加速技术被引量:1
《计算机应用》2022年第12期3841-3846,共6页徐启迪 刘争红 郑霖 
广西自然科学基金资助项目(2020GXNSFAA159067);无线宽带通信与信号处理重点实验室基金资助项目(GXKL06160112);认知无线电重点实验室项目(CRKL200102)。
随着通信技术的发展,通信终端逐渐采用软件的方式来兼容多种通信制式和协议。针对以计算机中央处理器(CPU)作为运算单元的传统软件无线电架构,无法满足高速无线通信系统如多进多出(MIMO)等宽带数据的吞吐率要求问题,提出了一种基于图形...
关键词:图形处理器 计算统一设备架构 低密度奇偶校验码 并行计算 信道译码 
活塞杆抛光表面微细缺陷的快速筛查技术被引量:1
《计算机集成制造系统》2021年第7期2005-2015,共11页姜庆胜 李研彪 计时鸣 
国家自然科学基金面上资助项目(51575494);浙江省自然科学基金重点资助项目(LZ14E050001)。
为了使汽车减振器活塞杆表面品质实现自动化快速检测,满足批量生产过程中的实时在线全检需求,提出一种基于计算统一设备架构(CUDA)的活塞杆抛光表面微细缺陷的快速筛查技术。该技术使用线扫描成像方法在活塞杆圆柱面高光反射情况下清晰...
关键词:机器视觉 表面缺陷 并行计算 计算统一设备架构 
基于CUDA流技术的深度学习系统优化被引量:4
《华中科技大学学报(自然科学版)》2020年第7期107-111,共5页蒋文斌 刘湃 陈雨浩 张杨松 
国家自然科学基金资助项目(61672250)。
为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在...
关键词:深度学习 计算统一设备架构(CUDA)流 训练速度 调度算法 准确率 
基于CUDA的地震倾角方位角并行算法被引量:2
《计算机应用》2019年第S02期175-178,共4页陈鹏程 向伟铭 张全 
为提高三维地震信号数据倾角、方位角算法的计算速度,针对其计算过程特点,提出了一种基于CUDA的并行算法。首先,对倾角方位角算法进行模块化分析并找到算法的计算瓶颈;然后,分别从差分计算、滤波以及后续的倾角方位角计算步骤入手,进行...
关键词:倾角 方位角 并行计算 计算统一设备架构 
基于GPU的稀疏矩阵存储格式优化研究被引量:6
《计算机工程》2019年第9期23-31,39,共10页杨世伟 蒋国平 宋玉蓉 涂潇 
国家自然科学基金(61672298,61873326,61373136)
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提...
关键词:稀疏矩阵向量乘 计算统一设备架构 图形处理器 存储格式 浮点运算 
基于矩阵转换的卷积计算优化方法被引量:3
《计算机工程》2019年第7期217-221,228,共6页方玉玲 陈庆奎 
国家自然科学基金(61572325,60970012);高等学校博士学科点专项科研博导基金(20113120110008);上海重点科技攻关项目(14511107902,16DZ1203603);上海市工程中心建设项目(GCZX14014);上海智能家居大规模物联共性技术工程中心项目(GCZX14014);上海市一流学科建设项目(XTKX2012);沪江基金研究基地专项(C14001)
提出一种基于矩阵转换的高效卷积计算优化方法MCFA。根据输出矩阵的宽度和卷积核大小对输入矩阵进行分块,通过im2col方法转换输入矩阵子块和核函数矩阵,利用计算统一设备架构中封装的矩阵-矩阵乘法加速库提升卷积计算的速度。在此基础上...
关键词:深度学习 卷积计算 直接卷积 矩阵分块 计算统一设备架构 卷积优化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部