LAPACK

作品数:8被引量:12H指数:3
导出分析报告
相关领域:自动化与计算机技术理学更多>>
相关作者:李玉成顾乃杰刘斌斌谢幸李霞更多>>
相关机构:中国科学院软件研究所中国科学技术大学兰州大学安徽省计算与通讯软件重点实验室更多>>
相关期刊:《山西师范大学学报(自然科学版)》《计算机系统应用》《商丘师范学院学报》《小型微型计算机系统》更多>>
相关基金:国家科技重大专项国家自然科学基金中国科学院知识创新工程重要方向项目国家重大技术装备创新研制项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
ABEEMσπ模型中计算分子电荷分布加速方法的比较
《商丘师范学院学报》2014年第6期1-6,共6页杨忠志 马丽 
国家自然科学基金资助项目(No.21133005)
基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基...
关键词:ABEEMΣΠ模型 MPI GPU LAPACK CULA 对称非正定矩阵 
LAPACK线性方程求解函数在龙芯3A上的并行化被引量:1
《小型微型计算机系统》2014年第5期1085-1089,共5页刘斌斌 顾乃杰 任开新 张杰 
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助
针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多...
关键词:LAPACK BLAS 龙芯3A 多核 
基于龙芯3A的LAPACK函数优化
《计算机系统应用》2012年第11期63-67,共5页张斌 顾乃杰 何颂颂 刘斌斌 
国家"核高基"重大专项(2009ZX01028-002-003-005);国家自然科学基金(60833004);高等学校学科创新引智计划(B07033)
针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数的性能.用LAPACK自带的性能测试程序进行测试,实验结果表明,有240个LAPACK函数的性能提升达到30%以上,...
关键词:LAPACK BLAS 龙芯3A 优化 双单精度 
PLASMA自适应调优与性能优化的设计与实现
《计算机科学》2012年第4期282-286,共5页吕渐春 张云泉 王婷 肖玄基 
国家"863"曙光6000千万亿次高效能计算机系统研制项目(2009AA01A129);国家"863"高效能计算机及网格服务重大项目(2009AA01A134);国家重大专项核高基项目(2009ZX01036-001-002);中国科学院知识创新工程重大项目课题(KGCX1-YW-13);国家重大科研装备研制项目(ZDYZ2008-2);国家自然科学基金项目(61100073;61133005;61100066)资助
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLA...
关键词:LAPACK PLASMA 自适应调优 优化 
基于Linux的Fortran与C/C++混合编程被引量:3
《现代计算机(中旬刊)》2012年第2期57-60,共4页李霞 亓雪冬 
山东省青年基金项目(No.ZR2011FQ018)
Fortran、C/C++是用户数量最多,使用最为广泛的编程语言,存在大量优秀的软件包及源代码,通过混合编程可以合并不同语言的优势,充分利用目前存在的这些软件资源。分析在Linux系统中Fortran与C/C++混合编程基本原理和内部调用约定,并通过...
关键词:混合编程 FORTRAN F2C G77 LAPACK 
用矩阵法拟合新磁性材料的耦合参数J及朗道因子g
《山西师范大学学报(自然科学版)》2009年第2期58-61,共4页冯晓霞 
对于已制备的新磁性材料,考虑到其分子中不同位置磁性原子间的自旋相互作用能量及塞曼能,用矩阵法通过LAPACK软件包实现精确对角化求解其哈密顿量得出了配分函数,并应用Monte Carlo方法采用随机行走计算出磁化率,χ通过与实验中测定的...
关键词:新磁性材料 磁化机制 矩阵法 LAPACK MonteCarlo方法 
LAPACK中的分块算法及其效果被引量:5
《数值计算与计算机应用》2001年第3期172-180,共9页李玉成 
This paper shows two approaches to improve the performance of numeral al- gebra software by describing block algorithms in LAPACK. The block algorithms can make up higher level and more effcient BLAS programs. This pa...
关键词:LAPACK 分块算法 线性代数软件包 数值线性代数问题 
LAPACK的自动并行化工具研究被引量:3
《数值计算与计算机应用》2001年第2期130-133,共4页谢幸 李玉成 
LAPACK (Linear Algebra PACKage) is a subroutine library for solving the most common problems in numerical linear algebra, designed to run efficiently on shared-memory vector and parallel processors. Only the general s...
关键词:LAPACK 自动并行化 并行化工具 源代码分析 相关性分析 数据私有化 基本技术 
检索报告 对象比较 聚类工具 使用帮助 返回顶部