点运算

作品数:594被引量:398H指数:10
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:牟卫华王飞雪欧钢孙广富高毅更多>>
相关机构:国防科学技术大学中国科学院西安电子科技大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划华为科技基金项目中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-9
视图:
排序:
基于FPGA误差可控的浮点运算加速器研究
《计算机工程》2024年第5期291-297,共7页关明晓 刘嘉堃 张鸿锐 何安平 
浮点运算是高性能计算(HPC)领域的基础运算。在大数据与云计算的背景下,高性能计算平台需要处理的数据量与日俱增,而且浮点数的舍入误差在大规模、长时程的运算中会产生累积,因此,在提升浮点运算性能的同时保证计算结果的可靠性非常重...
关键词:现场可编程门阵列 浮点运算加速器 可控误差 异构系统 高可靠性 
基于GPU的稀疏矩阵存储格式优化研究被引量:6
《计算机工程》2019年第9期23-31,39,共10页杨世伟 蒋国平 宋玉蓉 涂潇 
国家自然科学基金(61672298,61873326,61373136)
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提...
关键词:稀疏矩阵向量乘 计算统一设备架构 图形处理器 存储格式 浮点运算 
基于申威26010处理器的扩展函数库实现与优化被引量:10
《计算机工程》2017年第1期61-66,71,共7页曹代 郭绍忠 张辛 
国家"863"计划项目(2009AA012201)
Intel,AMD和IBM都具有针对自身特点的向量扩展库。相比于传统的标量计算,向量化技术带来的加速比较高。为此,针对申威26010处理器开发向量数学库软件。在分析函数常用级数法和迭代法算法的基础上,结合三角函数、反三角函数、指数函数和...
关键词:浮点运算 数学函数 申威26010处理器 数据分段 指令调度 
一种高性能四倍精度浮点乘加器的设计与实现被引量:1
《计算机工程》2014年第2期294-299,共6页何军 黄永勤 朱英 
高精度、高性能浮点运算部件是高性能微处理器设计的重要部分。通过对传统双精度浮点乘加运算算法的研究,结合四倍精度浮点数据格式特点,设计并实现一种高性能的四倍精度浮点乘加器(QPFMA),该乘加器支持多种浮点运算,运算延迟为7拍,全...
关键词:浮点运算 乘加 四倍精度 高精度 参数化 
一种低延迟高吞吐率的浮点整型乘累加单元被引量:1
《计算机工程》2013年第6期91-94,102,共5页沈俊 沈海斌 虞玉龙 
针对目前浮点运算单元在处理向量点乘运算时存在数据相关性的问题,提出一种低延迟单周期的累加单元结构。该结构用于7级流水的可配置乘累加单元,可兼容双精度浮点、双单精度浮点以及32位有符号数,且能对后置模块进行操作数隔离与门控时...
关键词:浮点运算单元 乘累加 向量点乘 双精度 双单精度 
标志前缀加法器的结构优化设计被引量:2
《计算机工程》2010年第13期286-287,290,共3页许团辉 王玉艳 章建雄 
标志前缀加法器运算速度快但存在面积大的缺点。为满足实际应用中对浮点乘加单元面积的要求,对其进行结构优化得到基于Kogge-stone树结构的51位标志前缀加法器,采用模块级联减少运算单元个数,达到减小浮点乘加单元面积、降低功耗的目的...
关键词:标志前缀加法器 浮点运算 结构优化 
一种用于浮点乘法的边界筛选伪随机测试方法
《计算机工程》2008年第8期273-274,280,共3页周汇 俞军 程君侠 华霞 
复杂测试空间中难以命中的冷僻细节,导致在IEEE浮点算法测试过程中难以验证单条浮点运算的正确性。该文针对传统直接随机测试方法的缺点,提出一种边界筛选生成案例的测试方法。该方法对待测算法边界条件建模,求解边界条件,利用解来构造...
关键词:浮点运算 随机测试 修正模式 IEEE754标准 边界筛选 
用FPGA实现星载SAR实时成像处理器的工程方法被引量:3
《计算机工程》2006年第5期223-225,共3页熊君君 王贞松 姚建平 
国家自然科学基金资助项目(60303017);国家"863"计划基金资助项目(2002AA731146;2003AA135093;2002AA135223260)
根据星载SAR成像算法的原理,提出了一种用FPGA实现该成像处理器的有效方法。该处理器的体系结构由算法直接映射而来,同时根据算法内在的时间关系将流水处理和并行处理相结合,从而极大地减少了处理时间。根据算法各运算对数据的精度要求...
关键词:实时成像处理器 FPGA 流水处理 并行处理 浮点运算 定点运算 
TMS320C32与Am29F010的接口设计与编程技术被引量:1
《计算机工程》2003年第6期150-152,共3页黄天戍 张旭良 陆天波 庞辉 
基于TI公司的浮点运算DSP芯片,详细介绍了AMD公司的Am29F010 Flash Memory集成电路 。说明了如何实现DSP与Flash接口,同时给出了硬件设计电路和软件编程方法,并应用于实际系统中,实践表明该方法给系统设计带来极大方便。
关键词:TMS320C32 Am29F010 接口设计 浮点运算 数字信号处理器 编程技术 
检索报告 对象比较 聚类工具 使用帮助 返回顶部