面向申威异构众核处理器的矩阵乘分块参数模型  

Analytical Tile Size Model for Matrix Multiplication for Sunway Heterogeneous Many-core Architecture

在线阅读下载全文

作  者:陶小涵 庞建民[1] 朱雨 王博漾 徐金龙[1] TAO Xiaohan;PANG Jianmin;ZHU Yu;WANG Boyang;XU Jinlong(Information Engineering University,Zhengzhou 450001,China;Zhengzhou University,Zhengzhou 450001,China)

机构地区:[1]信息工程大学,河南郑州450001 [2]郑州大学,河南郑州450001

出  处:《信息工程大学学报》2023年第1期65-71,共7页Journal of Information Engineering University

基  金:国家自然科学基金资助项目(61702546)。

摘  要:针对矩阵乘计算的编译优化,解决了由于申威异构众核处理器复杂体系结构及存储层次导致的程序优化难问题,过程中循环分块参数对于程序的优化效果极为重要。基于申威最新一代SW26010-Pro异构众核处理器提出了矩阵乘计算分块参数模型,旨在为矩阵乘计算编译优化的计算分解提供分析模型支撑。模型通过对申威处理器上的存储空间及数据传输过程进行分析,能够确定最优循环分块参数,并对数据传输时间及程序执行时间做出预测。测试证明模型能够在存储空间限制条件下得到最优循环分块参数,且程序执行时间预测平均准确率达到了96.87%。The compiler optimization for matrix multiplication reduces the difficulty of program optimization caused by the complex architecture and storage hierarchy of Sunway heterogeneous many-core processor.In the process of compiler optimization,the tile size is extremely important for the optimization effect of the program.This paper proposes an analytical matrix multiplication tile size model based on SW26010-Pro heterogeneous many-core processor,aiming to provide analytical model support for the computation decomposition of matrix multiplication compiler optimization.The model can determine the optimal tile size,and predict the data transfer time and program execution time.The model is tested and proven to be able to obtain the optimal tile size under the storage space limitation,and the average accuracy of program execution time prediction reaches 96.87%.

关 键 词:异构众核处理器 矩阵乘计算 分块参数 分析模型 

分 类 号:TP314[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象