基于 Pentium Pro 的高性能 BLAS 的设计与实现  被引量:4

Design and Implementation of High Performance BLAS for Pentium Pro

在线阅读下载全文

作  者:李忠泽[1] 陈瑾[1] 龙翔[1] 李未[1] 

机构地区:[1]北京航空航天大学

出  处:《北京航空航天大学学报》1998年第4期455-457,共3页Journal of Beijing University of Aeronautics and Astronautics

基  金:国家"八六三"高技术计划资助项目

摘  要:支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用.本文针对PentiumPro的体系结构特点,提出了一些优化方法使得BLAS在PentiumPro上计算性能达到最佳.测试表明,在200MHz的PentiumPro上BLAS3的速度可达112Mflops.BLAS is basic linear algebra libraries for science and engineering applications.It plays an important role in high performance computing. By identifying and optimizing frequently used, numerically intensive operations, BLAS can help in reducing the cost of computation, enhancing portability, and improving productivity.By taking advantage of the architectural features of Pentium Pro, a series of optimized methods are proposed to implement BLAS on Pentium Pro so that BLAS can perform optimally on Pentium Pro systems. The testing results demonstrate that the speed of BLAS3 can reach 112Mflops on 200MHz Pentium Pro.

关 键 词:寄存器 基本线性代数 子程序 BLAS 循环展开 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象