袁良

作品数:4被引量:10H指数:2
导出分析报告
供职机构:中国科学院更多>>
发文主题:多核GPU对角线存储方法数据存储方法更多>>
发文领域:自动化与计算机技术理学更多>>
发文期刊:《计算机研究与发展》《计算机科学》更多>>
所获基金:中国科学院知识创新工程重要方向项目国家自然科学基金国家重大技术装备创新研制项目国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
并行程序设计语言中局部性机制的研究被引量:4
《计算机科学》2020年第1期7-16,共10页袁良 张云泉 白雪瑞 张广婷 
国家重点研发计划(2017YFB0202001);中国科学院战略性先导科技专项(C类)(XDC01040100);国家自然科学基金(61432018,61521092,61602443);北京自然科学基金(L182053);中科院高效空间天气预报模式科技创新交叉与合作团队~~
大规模并行应用程序的性能优化和并行化的关键瓶颈之一在于多核CPU中越来越深和越来越复杂的存储层次。文中系统地分析和总结了当前主要多核CPU和并行程序设计语言中的局部性设计方法,提出了两种局部性,即横向局部性和纵向局部性,从这...
关键词:并行程序设计语言 并行程序设计模型 局部性 并行性 多核 
基于MPI和CUDA的蛋白质定量软件的设计和分析
《计算机科学》2013年第3期36-37,54,共3页詹科 王靖 袁良 张云泉 
中国科学院知识创新工程重大项目课题(KGCX1-YW-13)资助
介绍了蛋白质定量软件的设计及测试结果,分析结果表明:P-QuantWiz软件在曙光6000的Intel集群部分,测试规模达到2048核,在256核加速比仍在增加。相对P-QuantWiz软件在单CPU运行的结果,PG-QuantWiz软件在单GPU运行的加速比为8.1,在16个GP...
关键词:MPI CUDA 蛋白质定量 
对角线稀疏矩阵的SpMV自适应性能优化被引量:4
《计算机研究与发展》2013年第3期648-656,共9页孙相征 张云泉 王婷 李焱 袁良 
国家"八六三"高技术研究发展计划基金项目(2009AA01A129;2009AA01A134);国家"核高基"重大科技专项基金项目(2009ZX01036-001-002);中国科学院知识创新工程重大项目课题(KGCX1-YW-13);国家重大科研装备研制项目(ZDYZ2008-2);国家自然科学基金项目(61100073;61133005;61100066);中国科学院研究生科技创新与社会实践资助专项
稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用"对角线格式"有效描述矩阵的对角线分布,区别于以往通...
关键词:CRSD 自适应性能优化SpMV 对角线格式 对角线稀疏矩阵 GPU 科学应用 
基于横向局部性的多核计算模型被引量:2
《计算机科学》2012年第7期1-6,共6页袁良 张云泉 
863计划(2006AA01A125;2009AA01A129;2009AA01A134);核高基(2009ZX01036-001-002);中国科学院知识创新工程重大项目课题(KGCX1-YW-13);财政部国家重大科研装备研制项目(ZDYZ2008-2)资助
片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向...
关键词:多核 并行计算模型 共享缓存 横向局部性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部