检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京航空航天大学计算机科学与工程系
出 处:《北京航空航天大学学报》2001年第1期79-82,共4页Journal of Beijing University of Aeronautics and Astronautics
基 金:国家 8 63高技术计划资助项目!( 863 3 0 6 ZD 0 3 )
摘 要:利用SMP结构的多处理器结点通过高速网络构造高性能并行计算系统是当前的一种发展趋势 .为了使BLAS在SMP结点上具有更高的效率 ,本文讨论了BLAS3的多线程化问题 ;同时以SUMMA作为并行计算的实例 ,说明提高结点机程序的性能对并行计算性能的影响 .试验结果显示 ,在一定的条件下 ,多线程BLAS3在SMP平台上可以获得超线性加速比 ;结点计算性能的提高的同时必须提高网络有效带宽 ,才能充分发挥并行计算的效能 .It is the trend of using SMP board as the computing node of a high performance system. The benefits of multithreading is discussed and the BLAS3 is rewritten to get higher performance on a Dual Pentium II system. To investigate the relation between the performance of a single computing node and the entire parallel system, the SUMMA (Scalable Universal Matrix Multiplication Algorithm) is taken as an instance of our research works afterwards. The result demonstrates that the higher the performance of a SMP compute node is, the more sensitive to the capability of the SAN(System Area Network) the performance of the whole parallel system is.
关 键 词:并行处理 线性代数 最佳化 并行计算 多线程 BLAS SUMMA
分 类 号:TP311.11[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.175