检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术大学计算机科学与技术学院,合肥230027 [2]安徽大学计算机科学与技术学院,合肥230039
出 处:《小型微型计算机系统》2012年第3期594-597,共4页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(60833004)资助;国家"八六三"高技术研究发展计划项目(2008AA010902)资助
摘 要:FFT(Fast Fourier transform,快速傅立叶变换)是工程应用中的一个基本算法,优化其性能对于推广龙芯系列处理器的应用具有重要意义.本文充分挖掘龙芯3A处理器的硬件特性,对运算量和调整位序的过程作了优化并使用128位访存来减少访存指令的比例,从而实现了高效的FFT算法.实验结果表明,在825M龙芯3A处理器上经过优化后的一维FFT的速度是FF-TW库的2.5倍左右,而二维FFT的速度则是FFTW的3倍左右.To promote the application of Loongson processers,it is of enormous significance to optimize the performance of FFT(Fast Fourier transform),which is a basic tool in many engineering fields.In this paper,the hardware characteristics of loongson 3A processer are fully exploited based on some programming techniques,such as improving the computation and the bit reverse process and utilizing the Loongson 3A′s 128 bit memory access instructions to reduce the ratio of the memory instructions,and finally efficient FFT algorithms are implemented.The experiments show that the proposed 1d-fft and 2d-ff algorithms on 825MHz loongson 3A processor are about 2.5 and 3 times as fast as FFTW respectively.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222