基于ARM V8平台的向量算法库实现与优化  被引量:8

Vector Algorithm Library Implementation and Optimization Based on ARM V8 Platform

在线阅读下载全文

作  者:王晶 张云泉 梁军 WANG Jing;ZHANG Yunquan;LIANG Jun(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;Demonstration Center of Experimental Teaching in Comprehensive Engineering,Beijing Union University,Beijing 100101,China)

机构地区:[1]北京联合大学北京市信息服务工程重点实验室,北京100101 [2]北京联合大学工科综合实验教学示范中心,北京100101

出  处:《计算机工程》2019年第6期82-88,共7页Computer Engineering

基  金:国家重点研发计划(2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金重点项目(61272136);北京市教委科研计划(KM201811417006)

摘  要:基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8平台上的优化。实验结果表明,该方案在ARMV8计算平台上实现的向量算法库性能提升可达到10%~300%。Based on the VecOp vector algorithm library of ARM V8 architecture,this paper proposes a scheme of implementing and optimizing the basic vector algorithm lobrary on ARM V8 platform.The optimization is implemented from four aspects: memory access optimization,instruction set optimization,basic block optimization,and vector branch optimization,to improve the performance of vector algorithm functions on ARM V8 platform to optimize VecOp algorithm library on ARM V8 platform.Experimental results show that the performance of the vector algorithm library on the ARM V8 computing platform can be improved by 10%~300%.

关 键 词:数学函数库 ARMV8架构 向量算法库 单指令流多数据 访存优化 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象