矩阵乘法

作品数:320被引量:513H指数:9
导出分析报告
相关领域:自动化与计算机技术理学更多>>
相关作者:刘仲田希陆璐陈海燕田翔更多>>
相关机构:国防科学技术大学英特尔公司中国科学技术大学硅存储技术股份有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于TVM的变维批处理小矩阵乘法的加速及应用
《计算机科学》2025年第5期25-40,共16页戴翰文 陈长波 
国家重点研发计划(2023YFA1009402,2020YFA0712300);重庆英才计划青年拔尖项目(2021000263);重庆市院士牵头科技创新引导专项(cstc2021yszx-jcyjX0004,2022YSZX-JCX0011CSTB,CSTB2023YSZX-JCX0008)。
很多实际应用中需要高效计算大量不同维度的小矩阵乘积,如基于图神经网络的图分类需要将多个邻接矩阵与节点特征矩阵相乘。针对现有方法无法跨不同硬件平台高效计算此类维度各异(简称变维)批处理小矩阵乘法的问题,基于深度学习编译器TVM...
关键词:TVM 批处理矩阵乘法 变维矩阵乘法 
基于数据聚类的CSI反馈Transformer网络简化实现方法
《数据采集与处理》2025年第2期431-445,共15页还冬锐 张逸帆 姜明 
国家自然科学基金(62271137)。
为应对大规模多输入多输出(Multiple⁃input multiple⁃output,MIMO)系统中信道状态信息(Channel state information,CSI)反馈开销的日益增长,基于深度学习的CSI反馈网络(如Transformer网络)受到了广泛的关注,是一种非常有应用前景的智能...
关键词:信道状态信息反馈 多输入多输出 神经网络 近似矩阵乘法 聚类计算 
基于Matrix Core的高性能多维FFT设计与优化
《华南理工大学学报(自然科学版)》2025年第3期20-30,共11页陆璐 祝松祥 田卿燕 林海山 郭逸劼 
广东省重点领域研发计划项目(2022B0101070001)。
快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利...
关键词:图形处理器 Matrix Core 快速傅里叶变换 矩阵乘法 
面向SW26010P的异形矩阵乘法众核并行优化技术研究
《计算机工程与应用》2025年第6期150-163,共14页胡怡 陈道琨 杨超 
矩阵乘法广泛应用于科学与工程计算领域,是基础线性代数库中的关键优化对象。随着人工神经网络、计算流体力学等领域的快速发展,异形(irregular-shaped)矩阵乘法正在迅速引起关注。研究集中在针对国产新一代神威超级计算机采用的SW26010...
关键词:异形矩阵乘法 SW26010P众核处理器 多样化任务划分映射 RMA点对点机制 嵌套双缓冲技术 
网络模体的计数方法与模体邻接矩阵的表示
《大学数学》2025年第1期23-30,共8页王高峡 杨帆 侯喜妹 
宜昌市大学科学研究与应用项目(A21-3-018);三峡大学研究生课程建设项目(SDKC201933);安徽信息工程学院重点研究项目(23kytdzd004)。
复杂网络中高阶结构的研究基础是模体的计数及模体邻接矩阵的表示.三节点模体三边的连接关系可由矩阵乘积与Hadamard积表示.针对有向无权网络,在邻接矩阵表示的基础上,通过引入单边矩阵、双边矩阵与缺边矩阵,给出了三节点模体的矩阵计...
关键词:模体 模体邻接矩阵 计数 矩阵乘法 HADAMARD积 
基于组稀疏混合模型的遥感图像去噪方法
《应用数学进展》2025年第2期69-80,共12页张瑜舟 成丽波 
吉林省教育厅科学技术研究项目(JJKH20230788KJ);国家自然科学基金(12171054)。
在遥感图像的拍摄和传输过程中,会产生大量的噪声,高斯噪声和椒盐噪声是较为常见的两种噪声,目前的去噪算法对于这类混合噪声的去除普遍存在边缘模糊等问题。针对此问题,文章提出了一种新的基于组稀疏混合模型的遥感图像混合噪声的去除...
关键词:遥感图像去噪 混合噪声 组稀疏混合模型 双边矩阵乘法 块组 
面向矩阵乘计算的自动混合精度优化
《计算机科学》2024年第S02期756-765,共10页何昊天 周蓓 郭绍忠 张作言 郝江伟 冀立光 许瑾晨 
针对矩阵乘计算的混合精度优化的实现,极大地提升了矩阵乘计算的性能,但与高精度矩阵乘计算相比,混合精度矩阵乘计算时引入了误差。为有效降低混合精度计算中引入的误差,实现了一个面向矩阵乘计算的自动混合精度工具AMAO。该工具在低精...
关键词:混合精度 矩阵乘法 多面体模型 调度变换 代码生成 
面向飞腾处理器平台的快速卷积算法优化
《上海理工大学学报》2024年第6期610-619,共10页赵亚飞 杨耀功 王永刚 魏继增 
国家自然科学基金资助项目(61402321);天津市自然科学基金资助项目(23JCYBJC01770);2024年第一批天津市制造业高质量发展专项资金资助项目(24ZGNGX00020)。
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中...
关键词:深度学习 快速卷积算法 并行计算 通用矩阵乘法 
基于多面体模型的矩阵乘法自动混合精度优化
《计算机科学》2024年第12期110-119,共10页何昊天 周蓓 郭绍忠 张作言 郝江伟 许瑾晨 
混合精度是计算机中的一种数值计算技术,通过将计算中的部分数据类型从高精度转换成低精度来提高计算效率。矩阵乘法在计算机科学和数学中有着重要而广泛的应用,在矩阵乘法中使用混合精度技术来加速计算过程是一项很有挑战性的工作。现...
关键词:混合精度 矩阵乘法 多面体模型 调度变换 代码生成 
基于矩阵乘法关联的分级图像秘密共享方案
《计算机工程与设计》2024年第10期2905-2913,共9页陈庆鹏 张丽娜 孙佳琪 章静 
陕西省科技厅青年基金项目(2021JQ-575、2021JQ-576);陕西省教育厅基金项目(19JK0526);西安市科技计划基金项目(22GXFW0063);榆林市科技局基金项目(2016-24-4、2019-173)。
针对目前图像秘密共享中缺乏集合内或集合间多级权限控制的细粒度问题,提出一种基于矩阵乘法构造分级恢复的图像秘密共享方案。利用图像所具有的矩阵属性,在对原始像素干扰最小的情况下,通过矩阵可逆乘法构建秘密图像之间的关联矩阵,引...
关键词:图像秘密共享 门限秘密共享 线性代数 矩阵运算 图像关联 灰度图像 图像处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部