检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴振华[1,2] 唐秋艳[1] 王中杰[1] 马文静[1] 龙国平[1] 李玉成[1]
机构地区:[1]中国科学院软件研究所,北京100190 [2]中国科学院大学,北京100190
出 处:《大气与环境光学学报》2014年第3期237-243,共7页Journal of Atmospheric and Environmental Optics
基 金:国家"863"计划基金项目(2012AA010902);国家自然科学基金青年基金项目(61100072);国家自然科学基金青年科学基金项目(61303059)资助
摘 要:在自适应光学(AO)系统中,成像是不可或缺的一部分。AO仿真系统中的探测器和哈特曼-夏克波前传感器的成像过程一般用二维的离散卷积来计算,而通常它的数值算法用快速傅立叶变换(FFT)实现。但是随着矩阵维数的增加,卷积的运算量会急剧增大,成为制约整个AO仿真效率的一个瓶颈。利用图形处理器(GPU)的强大计算能力,可以使成像系统运行速度大幅提高。在NVIDIA Tesla C2050 GPU上,针对不同分辨率的图像,获得了相对于串行程序5-24倍的加速比。In the adaptive optics (AO) system, imaging is a very important process. The imaging process of the detectors and Hartman-Shack wavefront sensor in the AO simulation system is calculated with two-dimensional discrete convolution, whose numerical algorithm can be implemented with fast Fourier transformation (FFT). With the increase of the matrix size, the computation of convolution increases dramatically, and becomes a bottleneck of the AO system. To solve the problem, convolution on graphic processing unit(GPU) was implemented, which is a powerful accelerator in modern high performance computers. By applying various optimizations, significant performance improvement is obtained. On the NVIDIA Tesla C2050 GPU, a speedup of 5 to 24 times compared to serial program on the CPU with different image sizes is achieved.
关 键 词:自适应光学系统 成像 卷积 快速傅立叶变换 图形处理器
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.101.237