检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京航空航天大学
出 处:《北京航空航天大学学报》1998年第4期455-457,共3页Journal of Beijing University of Aeronautics and Astronautics
基 金:国家"八六三"高技术计划资助项目
摘 要:支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用.本文针对PentiumPro的体系结构特点,提出了一些优化方法使得BLAS在PentiumPro上计算性能达到最佳.测试表明,在200MHz的PentiumPro上BLAS3的速度可达112Mflops.BLAS is basic linear algebra libraries for science and engineering applications.It plays an important role in high performance computing. By identifying and optimizing frequently used, numerically intensive operations, BLAS can help in reducing the cost of computation, enhancing portability, and improving productivity.By taking advantage of the architectural features of Pentium Pro, a series of optimized methods are proposed to implement BLAS on Pentium Pro so that BLAS can perform optimally on Pentium Pro systems. The testing results demonstrate that the speed of BLAS3 can reach 112Mflops on 200MHz Pentium Pro.
关 键 词:寄存器 基本线性代数 子程序 BLAS 循环展开
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.175