GPGPU

作品数:169被引量:389H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:马安国魏晓辉邢座程王志英徐新海更多>>
相关机构:山东浪潮科学研究院有限公司国防科学技术大学吉林大学长沙景美集成电路设计有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=电子电信x
条 记 录,以下是1-10
视图:
排序:
基于“承影”GPGPU的张量处理器设计
《微电子学与计算机》2024年第5期109-116,共8页师雨洁 杨轲翔 刘旭东 何虎 
针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于...
关键词:通用图形处理器 张量处理器 卷积 通用矩阵乘 指数运算 
一种节省资源的矩阵运算单元硬件微架构设计
《现代电子技术》2024年第5期160-166,共7页潘于 田映辉 张伟 杨建磊 申奇 
为了实现人工智能和高性能计算在不同应用领域下的快速运算,需借助人工智能加速器(NPU)或者通用图形处理器(GPGPU)对其进行加速。由于矩阵运算是人工智能和高性能计算的核心运算,文中提出一种节省资源的矩阵运算单元架构的实现方案。通...
关键词:人工智能 高性能计算 矩阵运算 节省资源 低时钟延迟 GPGPU 
一种面向二维三维卷积的GPGPU cache旁路系统被引量:1
《西安电子科技大学学报》2023年第2期92-100,共9页贾世伟 张玉明 秦翔 孙成璐 田泽 
装备联合基金(6141B05200305)。
通用图形处理器作为卷积神经网络的核心加速平台,其处理二维、三维卷积的性能,决定着神经网络在实时目标识别检测领域的有效应用。然而,受其固有cache系统功能的限制,当前通用图形处理器架构无法实现二维、三维卷积的高效加速。针对此问...
关键词:卷积 通用图形处理器 存储系统 cache旁路 
一种针对栅栏同步的GPGPU微架构优化设计
《固体电子学研究与进展》2023年第1期70-77,共8页贾世伟 张玉明 田泽 秦翔 
装备联合基金资助项目(6141B05200305)。
为了降低通用图形处理器(GPGPU)中栅栏同步开销对程序性能产生的不良影响,提出了一种GPGPU微架构优化设计。该设计在线程束调度模块中,根据栅栏同步开销决定各线程束的调度顺序,确保高栅栏同步开销的线程束能够优先调度执行。在一级数...
关键词:通用图形处理器 栅栏同步 线程束调度 一级数据缓存 缓存旁路 性能 
通用图形处理器GPGPU在自动测试生成中的应用被引量:2
《集成电路应用》2020年第5期34-35,共2页黄宇翔 
广东省教育系统科技创新课题项目。
探索加速自动测试生产的效率,对降低集成电路测试成本、缩短设计周期有着重要意义。基于通用图形处理器GPGPU的特性,以及自动测试的运行过程,探索GPGPU对自动测试生成的加速效果。
关键词:集成电路制造 通用图形处理器 自动测试 生成 加速 
数字经济浪潮下,如何做AI芯片?
《电子产品世界》2019年第8期23-25,共3页迎九 
在不久前南京召开的“全球半导体市场与应用趋势论坛”上,系统级技术初创公司——天数智芯的创始人兼董事长李云鹏向媒体介绍了该公司从系统切入AI芯片的策略。
关键词:AI 芯片 大数据 GPGPU 
Numerical Simulation of an All Optical Flip-Flop Based on a Nonlinear Distributed Bragg Reflector Laser Structure
《Optics and Photonics Journal》2016年第9期217-228,共13页Hossam Zoweil 
A new design for an all optical flip flop is introduced. It is based on a nonlinear Distributed Bragg Reflector (DBR) semiconductor laser structure. The device does not require a holding beam. An optical gain medium c...
关键词:All-Optical Flip-Flop Distributed Bragg Reflector Nonlinear Grating GPGPU 
Memory bandwidth optimization of SpMV on GPGPUs
《Frontiers of Computer Science》2015年第3期431-441,共11页Chenggang Clarence YAN Hui YU Weizhi XU Yingping ZHANG Bochuan CHEN Zhu TIAN Yuxuan WANG Jian YIN 
It is an important task to improve performance for sparse matrix vector multiplication (SpMV), and it is a difficult task because of its irregular memory access. Gen- eral purpose GPU (GPGPU) provides high computi...
关键词:GPGPU performance tuning SpMV cacheblocking memory bandwidth 
一种雷达虚拟回波并行模拟生成平台
《太赫兹科学与电子信息学报》2014年第3期409-415,424,共8页金侃 叶春茂 杨健 鲁耀兵 余继周 
国家自然科学基金资助项目(面上项目;重点项目;重大项目)
为研究目标雷达回波高逼真度模拟生成对雷达系统设计及雷达信息获取理论,通过物理光学的电磁计算模拟目标电磁特性,并结合系统参数和波形应用生成相应的雷达虚拟回波。为提高电大尺寸目标雷达回波模拟的计算效率,构建了一种基于通用图...
关键词:雷达回波生成 物理光学法 GPGPU并行计算 多卡调度 
基于GPGPU的LDPC解码访存优化技术
《中国科技论文》2013年第7期626-632,共7页原略超 张洋 唐川 邢座程 
高等学校博士学科点专项科研基金资助项目(20114307110001);国家自然科学基金资助项目(60873016;61170083)
低密度奇偶校验码(low-density parity-check,LDPC)作为一类高性能的差错控制编码被用于多个通信标准中,但解码算法计算量巨大,限制了其潜能,基于通用图形处理器(general-purpose GPU,GPGPU)的LDPC解码器由于其灵活性,近年来备受关注。...
关键词:低密度奇偶校验码解码器 和积算法 通用图形处理器 优化策略 并行计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部