全搜索算法的SSE并行优化  

SSE Parallel Optimization for Full Search

在线阅读下载全文

作  者:陶志强[1] 徐萌[2] 徐荣飞[2] 

机构地区:[1]广东省电信规划设计院有限公司 [2]北京邮电大学网络系统与网络文化北京市重点实验室,北京100876

出  处:《微计算机应用》2011年第11期35-39,共5页Microcomputer Applications

摘  要:在基于宏块划分的视频编码算法中,运动估计阶段因为其庞大的计算量占用了绝大多数的编码时间。特别是在对高清视频进行编码时,运动估计已经成为提升编码性能的最大瓶颈。本文通过对全搜索运动估计算法进行基于像素的并行化修改和优化,使用SSE指令调用CPU的SIMD单元同时对当前宏块与参考宏块的多个像素进行SAD运算,对运动估计进行了并行化的实现。在相同的硬件环境以及保证编码质量的前提下,相对于传统的全搜索CPU运算获得了2倍以上的编码性能提升。In video coding algorithm based on macro block partition,a motion estimation stage occupies most of the encoding time because of its huge amount of calculation. In this paper, based on the full search algorithm with parallel modification and optimization, introducing the following way to realize the parallel computing: calling SIMD units of CPU by SSE instructions to do SAD operations simultaneously on multiple pairs of pixels. The realization won more than 2 times coding performance improvements relative to conventional CPU's computing of guaranteeing quality of coding premise in comparable hardware environment.

关 键 词:图像处理 并行处理 视频编码 SSE 

分 类 号:TN919.81[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象