李佳佳

作品数:4被引量:6H指数:2
导出分析报告
供职机构:复旦大学计算机科学技术学院更多>>
发文主题:GPU集群可移植性异构编程模型编程框架更多>>
发文领域:自动化与计算机技术自然科学总论更多>>
发文期刊:《计算机应用与软件》《小型微型计算机系统》《计算机工程》更多>>
所获基金:国家重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
面向节点异构GPU集群的编程框架被引量:3
《计算机工程》2015年第2期292-297,共6页盛冲冲 胡新明 李佳佳 吴百锋 
复旦大学ASIC和系统国家重点实验室基金资助项目;华为创新研究计划基金资助项目
基于异构GPU集群的主流编程方法是MPI与CUDA的混合编程或者其简单变形。因为对底层的集群架构不透明,程序员对GPU集群采用MPI与CUDA编写应用程序时需要人为考虑硬件计算资源,复杂度高、可移植性差。为此,基于数据流模型设计和实现面向...
关键词:GPU集群 异构 分布式并行编程框架 代码转换 任务分配 可移植性 
基于异构GPU集群的并行分布式编程解决方案被引量:1
《计算机应用与软件》2014年第9期28-31,176,共5页李佳佳 胡新明 吴百锋 
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大...
关键词:GPU集群 编程模型 数据级并行 
面向通用计算GPU集群的任务自动分配系统被引量:2
《计算机工程》2014年第3期103-107,119,共6页胡新明 盛冲冲 李佳佳 吴百锋 
当前GPU集群的主流编程模型是MPI与CUDA的松散耦合,采用这种编程模型进行编程,存在编程复杂度大、程序的可移植性差、执行效率低等问题。为此,提出一种面向通用计算GPU集群的任务自动分配系统StreamMAP。对编译器进行改造,以编译制导的...
关键词:GPU集群 异构 编程模型 任务分配 可移植性 可扩展性 
奇偶合并排序的数据级并行实现
《小型微型计算机系统》2012年第6期1343-1349,共7页张珂良 李佳佳 陈钢 吴百锋 
专用集成电路与系统国家重点实验室(复旦大学)和AMD大学合作计划基金项目资助
针对奇偶合并排序中存在的巨大数据级并行性潜力,通过将其实现于提供了强大数据级并行性的GPU处理器之上而获取较高的加速比.同时,针对OpenCL不支持各工作组间的工作线程的同步问题,提出两种解决方法,一种是通过主机程序控制迭代过程,...
关键词:奇偶合并排序 数据级并行 通用目的计算 图形处理器 OPENCL 
检索报告 对象比较 聚类工具 使用帮助 返回顶部