基于多GPU的三维Kirchhoff积分法体偏移  

3D Kirchhoff integral prestack migration based on GPUs

在线阅读下载全文

作  者:刘伟峰 赵改善[3] 孔祥宁[3] 蔡杰雄[3] 张兵[3] 

机构地区:[1]中国石油化工股份有限公司石油勘探开发研究院,北京100083 [2]中国石油化工集团公司多波地震技术重点实验室,北京100083 [3]中国石油化工股份有限公司石油物探技术研究院,江苏南京210014

出  处:《华中科技大学学报(自然科学版)》2011年第S1期110-114,共5页Journal of Huazhong University of Science and Technology(Natural Science Edition)

基  金:国家高技术研究发展计划资助项目(2009AA01A140);中国石化集团科技开发项目

摘  要:提出3种策略挖掘三维Kirchhoff积分法体偏移在众核GPU(图形处理器)上的并行性.首先,使用数据传输线程和GPU计算线程构造流水线并行框架,基于此框架直接实现异步输入输出(I/O)以减少GPU和网络存储之间数据传输所需的时间;其次,使用GPU的线程满载策略以使指令吞吐量最大化;最后,应用纹理缓存和常量缓存来减少片外存储器访问,并使用固定功能单元计算超越函数.实验结果表明:相比于IntelXeon E5430CPU上的算法串行版本,在nVidia Tesla C1060GPU上的优化算法实现了约20倍的加速比.比较了算法在3种不同GPU架构上的性能,并给出了CPU与GPU结果在0.5×10-4误差限下仅0.3×10-5的浮点数绝对误差.提出3种策略挖掘三维Kirchhoff积分法体偏移在众核GPU(图形处理器)上的并行性.首先,使用数据传输线程和GPU计算线程构造流水线并行框架,基于此框架直接实现异步输入输出(I/O)以减少GPU和网络存储之间数据传输所需的时间;其次,使用GPU的线程满载策略以使指令吞吐量最大化;最后,应用纹理缓存和常量缓存来减少片外存储器访问,并使用固定功能单元计算超越函数.实验结果表明:相比于IntelXeon E5430CPU上的算法串行版本,在nVidia Tesla C1060GPU上的优化算法实现了约20倍的加速比.比较了算法在3种不同GPU架构上的性能,并给出了CPU与GPU结果在0.5×10-4误差限下仅0.3×10-5的浮点数绝对误差.

关 键 词:并行计算 图形处理器 Kirchhoff积分法体偏移 流水线并行 异步输入输出 计算统一设备架构 

分 类 号:N55[自然科学总论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象