检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国石油大学(华东)计算机与通信工程学院,山东青岛266580 [2]江苏中科梦兰电子科技有限公司国家级企业技术中心,江苏苏州215500
出 处:《计算机工程与设计》2017年第12期3361-3367,3373,共8页Computer Engineering and Design
基 金:江苏省工业和信息产业转型升级专项基金项目
摘 要:为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。To improve the ability of multimedia processing on Loongson platform,the LoongSIMD instruction system of GS464/GS464 ECPU core was analyzed,and the SIMD instruction level optimization method was proposed.Open source H.264 decoder of FFmpeg was finely optimized while analyzing the parallel characters of algorithms,combining Loongson distinctive architectures and performance counter,intrinsic SIMD instructions and load/store memory extension instructions were embedded in hotspot functions.The average performance is improved by 50%.This work is contributed to Loongson open source community.User experience to multimedia applications is enhanced on Loongson computers.
关 键 词:单指令流多数据流 龙芯3A GS464 GS464E微架构 FFmpeg多媒体库 H.264解码优化
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.61.216