基于龙芯SIMD技术的H.264视频解码优化  被引量:5

H.264 video decoder optimization based on SIMD of Loongson CPU

在线阅读下载全文

作  者:顾丽红[1] 王锐 陈华才 吴少刚[1,2] 

机构地区:[1]中国石油大学(华东)计算机与通信工程学院,山东青岛266580 [2]江苏中科梦兰电子科技有限公司国家级企业技术中心,江苏苏州215500

出  处:《计算机工程与设计》2017年第12期3361-3367,3373,共8页Computer Engineering and Design

基  金:江苏省工业和信息产业转型升级专项基金项目

摘  要:为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。To improve the ability of multimedia processing on Loongson platform,the LoongSIMD instruction system of GS464/GS464 ECPU core was analyzed,and the SIMD instruction level optimization method was proposed.Open source H.264 decoder of FFmpeg was finely optimized while analyzing the parallel characters of algorithms,combining Loongson distinctive architectures and performance counter,intrinsic SIMD instructions and load/store memory extension instructions were embedded in hotspot functions.The average performance is improved by 50%.This work is contributed to Loongson open source community.User experience to multimedia applications is enhanced on Loongson computers.

关 键 词:单指令流多数据流 龙芯3A GS464 GS464E微架构 FFmpeg多媒体库 H.264解码优化 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象