向量化友好的循环分块因子选择算法  被引量:1

Vectorization-Friendly Tile Size Selection Algorithm

在线阅读下载全文

作  者:柴晓菲[1] 刘松[1] 屈彬 王倩[1] 伍卫国[1] CHAI Xiaofei;LIU Song;QU Bin;WANG Qian;WU Weiguo(School of Electronic and Information Engineering,Xi’an Jiaotong University,Xi’an 710049,China)

机构地区:[1]西安交通大学电子与信息工程学部,西安710049

出  处:《计算机工程与应用》2020年第15期37-42,共6页Computer Engineering and Applications

基  金:国家重点研发计划(No.2017YFB0203003);国家自然科学基金(No.91630206,No.61672423)。

摘  要:具有病态规模的嵌套循环程序在进行循环分块时容易忽略分块因子对向量化的影响,导致非对齐数据访问,降低分块后循环代码的性能。提出了一种向量化友好的循环分块因子选择算法VEC-TSS。该算法对可向量化循环层以向量化收益分析确定分块因子,对其他循环层通过以局部性收益和并行粒度确定分块因子。实验结果表明,针对具有病态规模的循环程序,VEC-TSS算法与另外两种分块因子选择算法相比可以获得更好的程序加速比,同时具有良好的可扩展性。The effect of tile sizes on vectorization tends to be ignored when performing loop tiling on a nested loop with a pathological problem size,which results in unaligned data access and performance degradation of tiled loop codes.This paper proposes a VECtorization-friendly Tile Size Selection(VEC-TSS)algorithm to solve the problem.The algorithm calculates the tile size of vectorizable loop by maximum vectorization profit,and it determines the tile sizes of other loops based on locality analysis and parallel granularity.Experimental results show that VEC-TSS algorithm achieves a better speedup over other two tile size selection algorithms on pathological-size loop cases.The results also prove that the VEC-TSS algorithm has good scalability.

关 键 词:向量化 循环分块 分块因子选择 CACHE优化 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论] TP314[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象