基于扩展寄存器与片上网络的运算阵列设计  被引量:1

Design of Computing Array Based on Extended Register and Network-on-Chip

在线阅读下载全文

作  者:张家杰[1] 欧鹏[1] 俞政[1] 于学球[1] 虞志益[1] 

机构地区:[1]复旦大学专用集成电路与系统国家重点实验室,上海201203

出  处:《计算机工程》2013年第7期7-10,15,共5页Computer Engineering

基  金:国家自然科学基金资助项目(61103008);国家科技重大专项基金资助项目(2011ZX03003-003-03);上海市科委集成电路专项基金资助项目(10706200300);上海市青年科技启明星计划基金资助项目(11QA1400500)

摘  要:为提高多核处理器性能,在传统硬件加速部件的基础上,提出一种新型的运算阵列设计方案。将运算阵列与多核处理器的通信端口映射在扩展寄存器地址空间上,实现阵列与多核处理器的紧密耦合。通过片上网络连接各个运算单元,实现运算阵列的灵活配置和高度共享。在实验系统上实现1 024点快速傅里叶变换和H.264解码器,结果表明,与纯软件实现相比,该方案能使处理器性能和功耗都有所改善。In order to improve the performance of multi-core processor, based on traditional hardware accelerator, this paper presents a novel computing array design scheme. The communication ports between the computing array and the processor are mapped in the address space of extended register file, which makes the computing array and the processor tightly coupled. The computing units are connected by Network-on-Chip(NoC) which enables the computing array be flexibly configured and highly shared by the multi-core processor. A 1 024-point Fast Fourier Transform(FFT) and an H.264 decoder are implemented on the experimental platform, and results show that the scheme can improve the performance and power consumption significantly compared to pure software solution.

关 键 词:多核处理器 运算阵列 扩展寄存器 片上网络 快速傅里叶变换 H 264解码器 

分 类 号:N945[自然科学总论—系统科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象