向量处理器

作品数:24被引量:38H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘仲陈海燕郭阳扈啸陈书明更多>>
相关机构:国防科学技术大学优创半导体科技有限公司高通股份有限公司三星电子株式会社更多>>
相关期刊:《移动通信》《计算机研究与发展》《电子与信息学报》《半导体技术》更多>>
相关基金:国家自然科学基金国家科技重大专项中央高校基本科研业务费专项资金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
《计算机工程与科学》2024年第7期1141-1150,共10页姜晶菲 何源宏 许金伟 许诗瑶 钱希福 
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产...
关键词:深度神经网络 图形处理器 向量处理器 稀疏矩阵乘 流水线 
长向量处理器高效RNN推理方法被引量:1
《国防科技大学学报》2024年第1期121-130,共10页苏华友 陈抗抗 杨乾明 
国家自然科学基金资助项目(61872377);湘江实验室基金资助项目(22XJ01012)。
模型深度的不断增加和处理序列长度的不一致对循环神经网络在不同处理器上的性能优化提出巨大挑战。针对自主研制的长向量处理器FT-M7032,实现了一个高效的循环神经网络加速引擎。该引擎采用行优先矩阵向量乘算法和数据感知的多核并行方...
关键词:多核DSP 长向量处理器 循环神经网络 并行优化 
MVSim:面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器
《计算机工程与科学》2024年第2期191-199,共9页刘仲 李程 田希 刘胜 邓让钰 钱程东 
国防科技大学自主基金(23-ZZCX-JDZ-11);PDL重点实验室基金(2021-KJWPDL-11)。
设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟...
关键词:体系结构模拟器 VLIW 多核向量处理器模型 性能模型 节拍精准模拟器 
面向多核向量处理器的矩阵乘法向量化方法被引量:9
《计算机学报》2018年第10期2251-2264,共14页刘仲 田希 
国家自然科学基金(61572025;61472432)资助
稠密矩阵乘法是大规模科学计算中许多算法的核心计算之一,文中提出一种高效的面向多核向量处理器的矩阵乘法向量化方法.提出一种按行计算的矩阵乘法向量化方法,该向量化方法的基本思想是每次同时计算C矩阵的一行元素,C矩阵第i行元素的值...
关键词:多核向量处理器 高性能计算 矩阵乘法 分块矩阵 向量化 
二维矩阵卷积在向量处理器中的设计与实现被引量:1
《国防科技大学学报》2018年第3期69-75,共7页张军阳 郭阳 
国家重点基础研究发展计划资助项目(2016YFB0200401);国家自然科学基金资助项目(61572025)
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数...
关键词:卷积神经网络 向量处理器 多核实现 矩阵卷积 
二维矩阵卷积的并行计算方法被引量:8
《浙江大学学报(工学版)》2018年第3期515-523,共9页张军阳 郭阳 扈啸 
国家自然科学基金资助项目(60133007;61572025);国家重点研发计划资助项目(2016YFB0200401)
为了提高卷积神经网络模型中二维矩阵卷积的计算效率,基于FT2000多核向量处理器研究二维矩阵卷积的并行实现方法.通过使用广播指令将卷积核元素广播至向量寄存器,使用向量LOAD指令加载卷积矩阵行元素,并通过混洗操作将不易并行化的矩阵...
关键词:矩阵卷积 向量处理器 并行算法 性能优化 卷积神经网络 
一种基于Matrix的QR分解向量化方法
《计算机工程与科学》2016年第2期210-216,共7页鲁庆男 刘仲 
千核级通用微处理器共享存储体系结构研究基金(61472432)
提出一种基于Matrix的Givens旋转的QR分解向量化方法。针对Matrix的体系结构特点,对向量数据访存和计算进行优化,使计算均衡分布到各个向量处理单元;设计双缓冲DMA的数据传输策略,使得内核的计算与DMA数据搬移的时间完全重迭,内核始终...
关键词:QR分解 向量处理器 Givens旋转 软件流水 
一种在线时间序列预测的核自适应滤波器向量处理器被引量:2
《电子与信息学报》2016年第1期53-62,共10页庞业勇 王少军 彭宇 彭喜元 
国家自然科学基金(61571160/F011305);中央高校基本科研业务费专项资金资助(HIT.NSRIF.201615)~~
针对信息物理融合系统中的在线时间序列预测问题,该文选择计算复杂度低且具有自适应特点的核自适应滤波器(Kernel Adaptive Filter,KAF)方法与FPGA计算系统相结合,提出一种基于FPGA的KAF向量处理器解决思路。通过多路并行、多级流水线...
关键词:核自适应滤波器 现场可编程逻辑门阵列 向量处理器 微码 
使用融合乘加加速快速傅里叶变换计算的向量化方法被引量:3
《国防科技大学学报》2015年第2期72-78,共7页刘仲 陈海燕 向宏卫 
国家自然科学基金资助项目(61133007;61472432)
融合乘加指令加速快速傅里叶变换计算的向量化方法,通过变换快速傅里叶变换的蝶形单元运算流程,将传统计算方式中独立的乘法和加法操作组合成次数更少的融合乘加操作,使得时间抽取法基2快速傅里叶变换算法的蝶形单元计算的实数浮点操作...
关键词:快速傅里叶变换 融合乘加 向量化 向量处理器 
支持原位计算的高效三角矩阵乘法向量化方法被引量:3
《国防科技大学学报》2014年第6期7-11,47,共6页刘仲 田希 陈磊 
国家自然科学基金资助项目(61133007)
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与DMA数据搬移完全重叠,让内核始终以峰值速度运行,...
关键词:三角矩阵乘法 原位计算 向量化 向量处理器 
检索报告 对象比较 聚类工具 使用帮助 返回顶部