H.264去块滤波算法在众核结构上的并行优化  被引量:2

Optimizing H.264 Deblocking Filter on Many-core Architectures

在线阅读下载全文

作  者:范灵俊[1,2] 颜成钢[3,2] 宋风龙[1] 马宜科[3] 范东睿[1] 

机构地区:[1]中国科学院计算技术研究所系统结构重点实验室,北京100190 [2]中国科学院研究生院,北京100049 [3]中国科学院计算技术研究所前瞻研究实验室,北京100190

出  处:《小型微型计算机系统》2011年第11期2263-2267,共5页Journal of Chinese Computer Systems

基  金:国家"九七三"重点基础研究发展计划项目(2011CB302500)资助;国家自然科学基金重点项目(60736012)资助;国家自然科学基金创新研究群体科学基金项目(60921002)资助;国家杰出青年科学基金项目(60925009)资助;北京市自然科学基金项目(4092044)资助

摘  要:在H.264视频解码中,去块滤波是运算量很大的一部分.由于去块滤波过程中,数据之间存在复杂的依赖性,现有的很多去块滤波并行方案存在着并行度小、同步互斥开销大的缺点.本文结合去块滤波算法及众核处理器Godson-T的结构特性,提出了一种可以减少数据依赖的去块滤波算法并行优化方案.相对于以前的很多方法,此并行方案首先在算法上增大了并行度,减少了同步开销,同时,我们通过片上众核处理器Godson-T的硬件支持,采用计算与通信重叠等优化策略,使得优化后的算法达到了数倍的性能提升.Deblocking filter accounts for a significant part of H. 264/AVC decoding time. As deblocking filter has compficated ,data dependencies, many previous methods have insufficient parallelism and significant synchronization overhead. In this paper, we develop an optimized implementation of deblocking filter based on Oodson-T many-core architecture. Compared to previous methods, we not only exploit the implicit parallelism but also reduce the synchronization overhead. Meanwhile, we adopt computation/communication overlapping via the architectural support of Oodson-T. The proposed method achieves better performance.

关 键 词:H.264 去块滤波 Godson-T众核 并行优化 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象