DSP芯片中的高能效FFT加速器  被引量:12

A High Energy Efficiency FFT Accelerator on DSP Chip

在线阅读下载全文

作  者:雷元武[1] 陈小文[1] 彭元喜[1] 

机构地区:[1]国防科学技术大学计算机学院,长沙410073

出  处:《计算机研究与发展》2016年第7期1438-1446,共9页Journal of Computer Research and Development

基  金:国家自然科学基金项目(61402499;61502508);湖南省自然科学基金项目(2015JJ3017)~~

摘  要:快速傅里叶变换(fast Fourier transform,FFT)是数字信号处理(digital signal processing,DSP)领域中最耗时的核心算法,该算法的计算性能和计算效率将影响整个应用的执行效率.因此,在DSP芯片上设计实现了一个基于矩阵转置操作的高能效可变长度FFT加速器,采用多种并行策略开发批量小规模FFT算法与大规模Cooley-Tukey FFT算法中指令级和任务级并行.设计"乒乓"多体数据存储器,重叠数据搬移和FFT计算之间的开销,提高FFT加速器计算效率.并基于此存储器,提出基于基本块的快速矩阵转置算法,从而避免对数据矩阵的列访问;提出混合旋转因子产生策略,结合查表和基于CORDIC算法在线计算方式,最大限度降低旋转因子产生的硬件开销.实验结果表明:FFT加速器原型的峰值能效为146GFLOPs/W,相比Intel Xeon CPU上的多线程FFTW实现,取得2个数量级的能效提升.Fast Fourier transform (FFT ) is a most time‐consuming algorithm in the domain of digital signal processing (DSP) .The performance and energy efficiency of FFT will make significant effect on different DSP applications .Thus ,this paper presents a high energy efficiency variable‐size FFT accelerator based on matrix transposition on DSP chip . Several parallel schemes are employed to exploit instruction level parallel and task level parallel of batch of small‐size FFTs or big‐size Cooley‐Tukey FFT .A “Ping‐Pong” structure of multi‐bank data memory (MBDM ) is presented to overlap the overhead of data move and FFT calculation . Moreover , based on MBDM , fast matrix transposition algorithm with basic block transposition is presented to avoid the matrix access with column‐wise and improve the utilization of DDR bandwidth .Hybrid twiddle factor generating scheme , combining lookup table and on‐line calculation with CORDIC ,is presented to reduce the hardware for twiddle factor .Experimental results show that our FFT accelerator prototype with power efficiency of 146 GFLOPs/W , achieves energy efficiency improvement by about two orders of magnitude with multi‐thread FFTW on Intel Xeon CPU .

关 键 词:快速傅里叶变换 加速器 高能效 矩阵转置 数字信号处理 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象