高性能子字并行运算单元的设计与实现  被引量:2

Design and Implementation of High Performance Subword-Parallel Arithmetic Units

在线阅读下载全文

作  者:董冕[1] 吴丹[1] 饶金理[1] 黄威[1] 戴葵[1] 邹雪城[1] 

机构地区:[1]华中科技大学电子科学与技术系,武汉430074

出  处:《计算机工程》2012年第16期249-252,共4页Computer Engineering

基  金:国家自然科学基金资助项目(NSFC 60976027;60973035);湖北省自然科学基金资助项目(ZRZ0051;2010CDB02705)

摘  要:通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工艺库下实现,并针对实际多媒体应用程序基于ESCA系统进行性能评测。实验结果表明,该运算单元可以在硬件开销和性能上获得较好的平衡。A set of subword-parallel arithmetic units is implemented with a hardware shared method. With pipelined design, the proposed units can perform one 64-bit, two 32-bit, four 16-bit, eight 8-bit fixed-point operations, or one double-precision, two single-precision floating-point operations in single cycle. The arithmetic units are designed with Verilog HDL and implemented in 0.18μm standard CMOS process. The performance is evaluated by a real multimedia application based on Engineering and Scientific Computing Accelerator(ESCA) system. Experimental results show that the subword-parallel arithmetic units have a good tradeoffbetween hardware cost and performance.

关 键 词:多媒体技术 子字并行 硬件共享 运算单元 ESCA系统 协处理器 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象