检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机研究与发展》2007年第10期1724-1732,共9页Journal of Computer Research and Development
基 金:国家自然科学基金项目(60533020;60673064);国家"八六三"高技术研究发展计划基金项目(2006AA01A116;2006AA01A116);国家"九七三"重点基础研究发展规划基金项目(2005CB321702);国家科技基础条件平台建设基金项目(2005DKA64002)
摘 要:广义Hermitian特征问题并行求解器的性能依赖于所选择的并行算法和矩阵的分布策略等诸多方面.基于块存储和快算法策略,提出了一个新的标准化转化的并行算法,该并行算法将Cholesky分解结合到广义特征问题标准化转换中,降低了已有并行算法的通信开销,并增加了算法的并行性.新算法可显著改善已有并行算法的性能和可扩展性.另外给出了一个有效求解具有多个右端项的三角矩阵方程AX=B的并行块算法.通过自主开发的特征问题并行软件包PSEPS的测试结果表明,并行算法比传统的并行算法快大约1倍,并具有较好的可扩展性.The performance of a generalized eigenproblem solver relies on many factors,which include selected parallel algorithms and matrix mapping strategy.A new parallelization is presented,which combines the Cholesky into the transformation from generalized to standard form.By reducing the communication cost and extending the parallelism,the new algorithm can obviously improve the performance and scalability of the original algorithm.Moreover,an efficient parallel algorithm is proposed to compute a triangular AX=B with multiple right hand sides.From the tests using the parallel software PSEPS,the speed of the parallel algorithm is about two times that of the classical parallel algorithms,and it has better performance and scalability than the classical parallel algorithms.
关 键 词:特征问题 块算法 CHOLESKY分解 并行计算 可扩展性
分 类 号:TP388.6[自动化与计算机技术—计算机系统结构] TP301.6[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33