检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:柴晓菲[1] 刘松[1] 屈彬 王倩[1] 伍卫国[1] CHAI Xiaofei;LIU Song;QU Bin;WANG Qian;WU Weiguo(School of Electronic and Information Engineering,Xi’an Jiaotong University,Xi’an 710049,China)
机构地区:[1]西安交通大学电子与信息工程学部,西安710049
出 处:《计算机工程与应用》2020年第15期37-42,共6页Computer Engineering and Applications
基 金:国家重点研发计划(No.2017YFB0203003);国家自然科学基金(No.91630206,No.61672423)。
摘 要:具有病态规模的嵌套循环程序在进行循环分块时容易忽略分块因子对向量化的影响,导致非对齐数据访问,降低分块后循环代码的性能。提出了一种向量化友好的循环分块因子选择算法VEC-TSS。该算法对可向量化循环层以向量化收益分析确定分块因子,对其他循环层通过以局部性收益和并行粒度确定分块因子。实验结果表明,针对具有病态规模的循环程序,VEC-TSS算法与另外两种分块因子选择算法相比可以获得更好的程序加速比,同时具有良好的可扩展性。The effect of tile sizes on vectorization tends to be ignored when performing loop tiling on a nested loop with a pathological problem size,which results in unaligned data access and performance degradation of tiled loop codes.This paper proposes a VECtorization-friendly Tile Size Selection(VEC-TSS)algorithm to solve the problem.The algorithm calculates the tile size of vectorizable loop by maximum vectorization profit,and it determines the tile sizes of other loops based on locality analysis and parallel granularity.Experimental results show that VEC-TSS algorithm achieves a better speedup over other two tile size selection algorithms on pathological-size loop cases.The results also prove that the VEC-TSS algorithm has good scalability.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.143.9.5