赵永华

作品数:38被引量:86H指数:4
导出分析报告
供职机构:中国科学院计算机网络信息中心更多>>
发文主题:对称矩阵并行计算对角化三对角矩阵GPU集群更多>>
发文领域:自动化与计算机技术理学电子电信自然科学总论更多>>
发文期刊:《科研信息化技术与应用》《计算机工程与设计》《微电子学与计算机》《计算机系统应用》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于批量LU分解的矩阵求逆在GPU上的有效实现
《软件学报》2023年第11期4952-4972,共21页刘世芳 赵永华 黄荣锋 于天禹 张馨尹 
国家重点研发计划(2020YFB0204802,2017YFB0202202);中国科学院战略性先导科技专项(C类)(XDC05000000);光合基金A类(20210701)。
给出批量矩阵的LU分解和批量求逆算法在GPU上实现及优化方法.针对批量LU分解问题,分析Left-looking和Right-looking等常用LU分解块算法在GPU上实现时对全局内存的数据读写次数,针对GPU架构特点,选择具有较少访存数据量的Left-looking块...
关键词:批量LU分解 选主元 行交换 批量矩阵求逆 延迟修正 动态方法 
垂直领域知识图谱构建及应用平台的设计与实现被引量:1
《数据与计算发展前沿》2023年第3期111-122,共12页张博尧 曹荣强 万萌 孙境棋 王彦棡 王珏 赵永华 
中国国家电网有限公司总部管理科技项目“自主可控电力人工智能开放平台关键技术研究”(5700-20215-8261A-0-0-00)。
【目的】知识图谱可以将客观世界的实体、概念、关系等抽象成图数据结构,是垂直领域建模和应用的研究热点,本文研发和实现了从资源调度、知识图谱构建到应用场景全过程的自动化和一体化平台。【方法】以微服务架构的方式部署了数据处理...
关键词:知识图谱 资源虚拟化 图表示学习 微服务技术 
批量厄米矩阵特征值分解的GPU算法
《计算机科学》2023年第4期397-403,共7页黄荣锋 刘世芳 赵永华 
国家重点研发计划(2017YFB0202202);中国科学院战略性先导科技专项(XDC05000000)。
批量矩阵计算问题广泛存在于科学计算与工程应用领域。随着性能的快速提升,GPU已成为解决这类问题的重要工具之一。矩阵特征值分解属于双边分解,需要使用迭代算法进行求解,不同矩阵的迭代次数可能不同,因此,在GPU上设计批量矩阵的特征...
关键词:厄米矩阵 特征值分解 批量计算 Roofline模型 性能分析 
基于GPU架构的两层并行块Jacobi SVD算法被引量:2
《数值计算与计算机应用》2022年第4期380-399,共20页黄荣锋 赵永华 于天禹 刘世芳 
国家重点研发计划(2017YFB0202202);中国科学院战略性先导科技专项(XDC05000000)
SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了...
关键词:奇异值分解 块Jacobi算法 并行算法 GPU 数据预取技术 
并行对称矩阵三对角化算法在GPU集群上的有效实现被引量:4
《计算机研究与发展》2020年第12期2635-2647,共13页刘世芳 赵永华 于天禹 黄荣锋 
国家重点研发计划项目(2017YFB0202202);中国科学院战略性先导科技专项(C类)(XDC01040000)。
对称矩阵三对角化是求解稠密特征问题的关键计算过程.针对GPU集群采用了MPI(message passing interface)和GPU级2级并行方法设计实现了基于MPI和CUDA(compute unified device architecture)的稠密对称矩阵三对角化算法.在MPI集群级并行...
关键词:对称矩阵三对角化 MPI+CUDA 点点数据通信 计算密集度 CUDA流 可扩展性 
广义稠密对称特征问题标准化算法在GPU集群上的有效实现
《计算机科学》2020年第4期6-12,共7页刘世芳 赵永华 于天禹 黄荣锋 
国家重点研发计划项目(2017YFB02022);中国科学院战略性先导科技专项(C类)(XDC01040000)。
广义稠密对称特征问题的求解是许多应用科学和工程的主要任务,并且是计算电磁学、电子结构、有限元模型和量子化学等计算中的重要部分。将广义对称特征问题转化为标准对称特征问题是求解广义稠密对称特征问题的关键计算步骤。针对GPU集...
关键词:广义对称特征问题标准化算法 GPU集群 CHOLESKY分解 转置算法 三角矩阵方程 
基于分治法求解对称三对角矩阵特征问题的MPI/Cilk混合并行算法被引量:4
《郑州大学学报(理学版)》2020年第1期33-38,共6页朱京乔 赵永华 
国家重点研发计划项目(2017YFB0202202,2016YFB0201302);国家自然科学基金重点项目(91430214);中国科学院“十三五”信息化建设专项项目(XXH13506-405)
对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进...
关键词:三对角矩阵 对称特征问题 并行计算 分治算法 Cilk MPI 
基于神威太湖之光架构的LOBPCG并行算法研究被引量:1
《数值计算与计算机应用》2019年第4期291-309,共19页于天禹 赵永华 赵莲 
国家重点研发计划“高性能计算应用软件协同开发工具与环境研究”(2017YFB0202202),国家重点研发计划高性能计算专项(2016YFB0201302)
LOBPCG是一种适合大规模稀疏对称问题的特征值数值解法.本文研究了适合神威太湖之光架构的LOBPCG并行算法.首先提出了基于主、从核的混合并行模型;研究了稀疏矩阵-向量积的并行算法,通过核组间通信隐藏、核组内通信隐藏等技术提高程序速...
关键词:LOBPCG 特征值 神威太湖之光 并行算法 
基于分治法求解对称三对角矩阵特征问题的混合并行实现
《计算机系统应用》2019年第9期246-250,共5页朱京乔 赵永华 
国家重点研发计划(2017YFB0202202,2016YFB0201302);中国科学院“十三五”信息化建设专项(XXH13506-405)~~
基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解...
关键词:并行计算 对称特征问题 分治算法 Cilk 
HPSEPS在元与神威·太湖之光上的移植和性能分析
《科研信息化技术与应用》2018年第2期46-52,共7页李燕 赵永华 王武 赵莲 
国家自然科学基金重点项目(91430214)
"神威·太湖之光"高效能计算机系统是世界上首台峰值运算速度超过10亿亿次量级的超级计算机,HPSEPS (High Performance Symmetric Eigenproblem Solvers)是自主开发的大规模对称稠密矩阵特征问题并行求解器,包括标准对称稠密矩阵特征问...
关键词:神威太湖之光 HPSEPS 软件移植 
检索报告 对象比较 聚类工具 使用帮助 返回顶部