CUDA

作品数:1130被引量:2404H指数:17
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈庆奎李晓霞李肯立冯前进武港山更多>>
相关机构:中国科学院中国科学院大学西安电子科技大学华中科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
GPU邻居搜索法在风沙流SPH算法中的应用
《计算机应用与软件》2025年第3期221-226,267,共7页周鹏 金阿芳 
国家自然科学基金项目(51968069)。
为了解决风沙流(Smoothed Particle Hydrodynamics,SPH)算法因粒子数目增多导致计算效率低的问题,将GPU并行计算应用在风沙流SPH算法中。分析SPH算法适合并行计算的原因,并以单元链表(Cell-Linked List,CLL)法的邻居搜索法为基础,建立SP...
关键词:SPH算法 风沙流 并行计算 CUDA 
前沿科技
《今日科技》2025年第3期50-51,共2页
人工智能科创高地宇树开源强化学习项目可支持训练到真机部署日前,宇树宣布开源其强化学习项目RL GYM,支持从训练、仿真到真机部署的全流程操作,用户可在预训练基础上进行仿真模拟,并迁移至宇树旗下三款实体机器人。训练阶段依赖英伟达I...
关键词:强化学习 人工智能 机器人 预训练 CUDA 前沿科技 操作控制 GPU 
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测
《工矿自动化》2025年第1期45-51,60,共8页李博 侍守伊 张建军 夏蕊 王学文 崔卫秀 倪强 
国家自然科学基金青年基金项目(52204149);山西省基础研究计划项目(202103021223080,202203021221051)。
为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视...
关键词:刮板输送机直线状态监测 CUDA加速 动态规划 全景拼接 霍夫变换 统一计算设备架构 
基于统一计算架构加速的γ能谱分析系统设计
《世界核地质科学》2024年第6期1203-1213,共11页谢浩浩 王仁波 陈锐 
国家自然科学基金项目(编号:12365026);江西省重点研发计划重点项目(编号:20232BBE50013);江西省自然科学基金(编号:20242BAB25046)资助。
在现代核科学与技术应用中,γ能谱分析是一种重要的技术手段,用于放射性核素的定性和定量分析。然而,传统的γ能谱分析系统在处理高通量数据时面临诸多挑战,尤其是在计算量大、处理速度慢的情况下,常常难以满足实际需求。因此,如何提高...
关键词:γ能谱分析 CUDA 加速计算 系统设计 
GPGPU和CUDA统一内存研究现状综述被引量:1
《计算机工程》2024年第12期1-15,共15页庞文豪 王嘉伦 翁楚良 
国家自然科学基金(62272171);浙江省“尖兵”“领雁”研发攻关计划(2022C04006)。
在大数据背景下,随着科学计算、人工智能等领域的快速发展,各领域对硬件的算力要求越来越高。图形处理器(GPU)特殊的硬件架构,使其适合进行高并行度的计算,并且近年来GPU与人工智能、科学计算等领域互相发展促进,使GPU功能细化,逐渐发...
关键词:通用图形处理器 统一内存 显存超额订阅 数据管理 异构系统 
重力场反演中大型矩阵GPU加速运算的实现
《深空探测学报(中英文)》2024年第6期587-593,共7页周予涵 简念川 陈从颜 
国家重点研发课题(2021YFC2203502)。
针对重力场反演中大型矩阵解算任务量大、解算时间长的问题,提出一种基于多片GPU并行的矩阵运算方法,该方法将多片图形处理器(Graphics Processing Unit,GPU)和CUDA(Computer Unified Device Architecture)相结合,能实现密集运算的高度...
关键词:行星重力场反演 GPU运算 并行计算 CUDA 
基于面向对象对CUDA架构的LBM计算程序优化
《桂林电子科技大学学报》2024年第6期579-584,共6页韦华健 张乾毅 张静静 李华兵 
国家自然科学基金(11362005)。
晶格玻尔兹曼方法(LBM)是一种新颖而有前途的计算流体力学方法,从算法的角度看,其迭代过程能被分化为多个子问题的并行程序,非常适合在高性能图像处理器(GPU)计算,获得极快的数据处理速度,同时有大量工作报告了基于GPU计算的LBM方法得...
关键词:晶格玻尔兹曼方法 面向对象 Poiseuille flow模型 CUDA 
GPU任务调度研究综述被引量:1
《小型微型计算机系统》2024年第11期2800-2807,共8页李来文 胡韬 邓庆绪 
国家自然科学基金项目(62072085)资助.
本文针对运行在GPU上的任务的管理和调度研究进行了综述,并且把讨论重点放在针对单GPU上的相关研究工作.随着人工智能技术的发展以及相关应用的普及,使得GPU成为加速计算的关键工具.本文首先介绍了GPU的架构和编程模型,然后按照调度粒度...
关键词:图形处理单元 CUDA GPU多任务 GPU调度 
Parallel Implementation of the CCSDS Turbo Decoder on GPU
《China Communications》2024年第10期70-77,共8页Liu Zhanxian Liu Rongke Zhang Haijun Wang Ning Sun Lei Wang Jianquan 
supported by the Fundamental Research Funds for the Central Universities(FRF-TP20-062A1);Guangdong Basic and Applied Basic Research Foundation(2021A1515110070)。
This paper presents a software turbo decoder on graphics processing units(GPU).Unlike previous works,the proposed decoding architecture for turbo codes mainly focuses on the Consultative Committee for Space Data Syste...
关键词:CCSDS CUDA GPU parallel decoding turbo codes 
基于指令流水线的CUDA核函数时间预测模型
《软件工程》2024年第10期74-78,共5页张建定 陈根浪 明宗禹 
对CUDA核函数(CUDA Kernel Function)在静态下的评估预测是任务调度与程序优化的一个关键组成部分。文章通过对CUDA核函数的PTX(Parallel Thread Execution)进行代码分析和特性建模,精心设计了一个时间预测模型。该模型基于指令流水线...
关键词:CUDA 时间预测 静态 PTX 流水线 
检索报告 对象比较 聚类工具 使用帮助 返回顶部