检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术大学计算机科学技术系
出 处:《计算机研究与发展》1999年第7期848-852,共5页Journal of Computer Research and Development
摘 要:矩阵乘积算法在科学计算中应用十分广泛.文中给出了典型矩阵乘积算法在曙光1000上的性能比较和分析,并针对SUMMA算法研究了分块尺寸对其通信性能的影响,指出分块尺寸是影响其通信性能的一个重要因素.原算法并没有给出其分块尺寸的具体选取方法,文中通过理论和实验的分析提出了一个选取最优分块尺寸的标准.实验结果显示SUMMA算法按文中的标准选取最优分块尺寸后性能得到大幅度提高,可达机器峰值的50.7%.Matrix multiplication is widely used in scientific computing. The performance of typical matrix multiplication algorithms on Dawning 1000 are compared and analyzed in this paper. The analysis shows that matrix block size is an important factor in the performance of the SUMMA algorithm, but how to choose the best block size is not considered in the original algorithm. A criterion is proposed here for choosing the best block size in the SUMMA algorithm after theoretic and experimental analysis. Higher performance is achieved by improving the SUMMA algorithm using this criterion. Experimental results show that it can reach 50.7% of the peak performance.
分 类 号:TP338.602[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.220.241.63