检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:蒋孟奇[1,2,3] 张云泉[1,3] 宋刚[1,2,3] 李玉成[1]
机构地区:[1]中国科学院软件研究所并行计算实验室,北京100080 [2]中国科学院研究生院,北京100080 [3]中国科学院计算机科学国家重点实验室,北京100080
出 处:《计算机工程》2008年第7期84-86,103,共4页Computer Engineering
基 金:国家自然科学基金资助项目(60303020);国家自然科学基金资助重点项目(60533020);国家“973”计划基金资助项目(2005CB321702);国家“863”计划基金资助项目(2006AA01A102,2006AA01A125)
摘 要:对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。This paper analyses the implementation mechanism of GOTOBLAS library, especially the high performance implementation of its General Matrix-matrix Multiplication(GEMM) routines, and shows how to achieve high performance. It can be concluded that the effects of hierarchical memory on application performance are brought into the design of new computational models. Experimental results verifies the high performance of GOTOBLAS compared with public domain available BLAS, and testifies the important effect of hierarchical memory on algorithm performance.
关 键 词:GOTOBLAS库 一般矩阵乘法 存储层次 分块算法 计算模型
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28