脉动阵

作品数:123被引量:166H指数:5
导出分析报告
相关领域:电子电信更多>>
相关作者:林军王春鸿李梅姜文汉文梅更多>>
相关机构:中国科学院国防科学技术大学南京大学北京大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划中国航空科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于FPGA脉动阵列的AES算法设计与实现
《数字技术与应用》2024年第12期172-174,共3页王光昕 
高级加密标准(Advanced Encryption Standard,AES)算法是一种常见的对称加密算法,在其加密过程中需要进行循环轮操作,包含字节替换、行移位、列混淆和轮密钥加等。其中,在列混淆的计算过程中,输入的数据都要在左边乘一个固定的矩阵,在F...
关键词:脉动阵列 对称加密算法 时钟周期 加密过程 高级加密标准 AES算法 字节替换 列混淆 
基于复数域前向放松QRD-RLS算法的脉动阵结构实现
《舰船电子工程》2024年第11期192-195,共4页张睿 李毅 邢金岭 
现代军用平台有限空间内集成了大量射频收发天线系统,导致共址电磁自兼容问题严重,干扰对消技术是解决共址同频干扰问题的一种重要手段。高跳速、环境剧烈变化场合对对消系统的处理速度提高了更高要求。论文提出了一种基于复数域QRD-RL...
关键词:QRD-RLS算法 复数域前向放松QRD-RLS算法 脉动阵结构 
基于FPGA的卷积神经网络加速器现状研究
《太赫兹科学与电子信息学报》2024年第10期1142-1153,1167,共13页张坤 高博 冀亚玮 谢宗甫 高飞 李宇东 
近年来,得益于计算机运算能力的提升和互联网所产生的大量数据,深度学习(DL)技术取得了快速发展,其中最显著的卷积神经网络(CNN)在图像识别、目标检测、自然语言处理等领域已经成功实现商用。然而随着网络层数越来越深,对计算能力和内...
关键词:卷积神经网络 FPGA加速器 网络压缩 卷积算法 脉动阵列 
面向脉动阵列神经网络加速器的软错误近似容错设计
《吉林大学学报(工学版)》2024年第6期1746-1755,共10页魏晓辉 王晨洋 吴旗 郑新阳 于洪梅 岳恒山 
国家自然科学基金项目(62272190,U19A2061)。
本文根据神经网络本身的错误弹性和层内过滤器相似性提出了一种近似容错设计,把过滤器划分成不同校验组进行不精确校验,保证严重错误被检出并恢复。通过优化过滤器-计算单元映射使校验流程与脉动阵列数据流契合,相较于传统双模冗余,本...
关键词:计算机系统结构 卷积神经网络 脉动阵列 软错误 近似容错 
基于DPI-C的脉动阵列模块验证平台
《计算机测量与控制》2023年第6期293-298,共6页王鑫 陈博 
国家自然科学基金(61703185);高等学校学科创新引智计划项目(B12018)。
针对卷积神经网络加速器中有关于脉动阵列模块的验证,提出并实现了一种基于直接编程接口C(DPI-C)程序的验证平台,采用内嵌DPI-C程序并利用通用验证方法学(UVM)满足脉动阵列模块中的浮点数乘加运算的验证需求;实验利用了SystemVerilog中...
关键词:直接编程接口C 验证平台 验证方法学 脉动阵列 人工智能芯片 
基于脉动阵列的基尼相关检测器算法研究
《工业控制计算机》2023年第5期95-96,共2页王柏鸿 徐维超 
信号检测普遍应用于各个工程领域,当噪声模型完全或部分可知的情况下,有各种最优或次优的参量检测方法,但是在实际场景中,对噪声的了解是非常少的。在这种情况下,研究者提出了在噪声模型未知的情况下仍具有较高稳健性的非参量的检测方...
关键词:雷达 信号检测 基尼相关检测器 FPGA 脉动阵列 
一种通用型卷积神经网络加速器架构研究被引量:2
《微电子学与计算机》2023年第5期97-103,共7页董刚 胡克坤 杨宏斌 赵雅倩 李仁刚 赵坤 曹其春 鲁璐 
山东省重点研发计划项目(2019TSLH0201);山东省自然科学基金创新发展联合基金(ZR2021LZH004)。
针对当前AI专用加速器设计复杂且存在内存瓶颈等不足,提出一种通用型卷积神经网络加速器架构.其RISC(Reduced Instruction Set Computer)指令集支持不同类型卷积神经网络到硬件加速器的高效映射.其通用卷积计算模块是一个由多个基本运...
关键词:AI加速器 卷积神经网络 多尺寸卷积核 三维脉动阵列 多级累加结构 
基于脉动阵列的层融合注意力模型加速器结构被引量:1
《计算机工程与科学》2023年第5期802-809,共8页刘晓航 姜晶菲 许金伟 
国家国防科技工业局国防科技重点实验室稳定支持重点项目(WDZC20215250103)。
注意力机制最近在深度神经网络中表现出优越的性能,但其计算包含复杂的数据流,内存开销和计算量大,需要定制加速器来优化推理计算。提出一种针对注意力机制计算的加速器结构。采用基于硬件控制的灵活分块方法,将模型中的巨大矩阵分成硬...
关键词:脉动阵列 注意力机制 层融合 加速器结构 矩阵分块 柔性最大值传输函数 
一种矩阵块间提前切换的脉动阵列优化策略
《计算机工程与科学》2023年第1期1-9,共9页鞠鑫 曹亚松 文梅 汪志 冯静 
国家自然科学基金(62002366)。
AI应用对硬件算力的需求逐年增加,驱使着AI加速器不断向更高的性能演化。研究表明,AI应用的主要运算形式可以转化为矩阵乘运算,脉动阵列因为在矩阵乘运算上的独特优势,使其成为了主流矩阵乘加速技术之一。然而,矩阵在注入和流出脉动阵...
关键词:脉动阵列 AI 矩阵乘 加速器 PE利用率 
一种低延迟同态加密电路设计
《合肥工业大学学报(自然科学版)》2022年第8期1046-1050,共5页徐鹏飞 李桢旻 王晓蕾 杜高明 
国家重点研发计划资助项目(2018YFB2202604);安徽省高校协同创新资助项目(GXXT-2019-030)。
为了解决同态加密方案加密所需时间太长的问题,文章基于改进的脉动阵列技术提出一种优化的硬件架构对GSW(Gentry-Sahai-Waters)全同态加密算法中的加密部分进行硬件加速。GSW全同态加密算法在不同的安全等级下选取的安全参数不同,若安...
关键词:同态加密 脉动阵列 访存优化 数据拼接及复用 低延迟 
检索报告 对象比较 聚类工具 使用帮助 返回顶部