检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:范灵俊[1,2] 颜成钢[3,2] 宋风龙[1] 马宜科[3] 范东睿[1]
机构地区:[1]中国科学院计算技术研究所系统结构重点实验室,北京100190 [2]中国科学院研究生院,北京100049 [3]中国科学院计算技术研究所前瞻研究实验室,北京100190
出 处:《小型微型计算机系统》2011年第11期2263-2267,共5页Journal of Chinese Computer Systems
基 金:国家"九七三"重点基础研究发展计划项目(2011CB302500)资助;国家自然科学基金重点项目(60736012)资助;国家自然科学基金创新研究群体科学基金项目(60921002)资助;国家杰出青年科学基金项目(60925009)资助;北京市自然科学基金项目(4092044)资助
摘 要:在H.264视频解码中,去块滤波是运算量很大的一部分.由于去块滤波过程中,数据之间存在复杂的依赖性,现有的很多去块滤波并行方案存在着并行度小、同步互斥开销大的缺点.本文结合去块滤波算法及众核处理器Godson-T的结构特性,提出了一种可以减少数据依赖的去块滤波算法并行优化方案.相对于以前的很多方法,此并行方案首先在算法上增大了并行度,减少了同步开销,同时,我们通过片上众核处理器Godson-T的硬件支持,采用计算与通信重叠等优化策略,使得优化后的算法达到了数倍的性能提升.Deblocking filter accounts for a significant part of H. 264/AVC decoding time. As deblocking filter has compficated ,data dependencies, many previous methods have insufficient parallelism and significant synchronization overhead. In this paper, we develop an optimized implementation of deblocking filter based on Oodson-T many-core architecture. Compared to previous methods, we not only exploit the implicit parallelism but also reduce the synchronization overhead. Meanwhile, we adopt computation/communication overlapping via the architectural support of Oodson-T. The proposed method achieves better performance.
关 键 词:H.264 去块滤波 Godson-T众核 并行优化
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.227.111.102