国家自然科学基金(60633050)

作品数:35被引量:66H指数:5
导出分析报告
相关作者:窦勇窦文华杨学军董亚卓孙全宝更多>>
相关机构:国防科学技术大学河南公安高等专科学校中国航天员科研训练中心装甲兵工程学院更多>>
相关期刊:《计算机学报》《计算机工程与设计》《湖南大学学报(自然科学版)》《计算机辅助设计与图形学学报》更多>>
相关主题:FPGA光突发交换QOS流水线偏射路由更多>>
相关领域:自动化与计算机技术电子电信理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
片上网络二维和三维结构的通信性能分析被引量:5
《计算机工程与科学》2011年第3期34-40,共7页钱悦 鲁中海 窦强 窦文华 
国家自然科学基金资助项目(60633050)
芯片集成技术的迅猛发展,使得片上网络从二维向三维扩展成为可能。研究表明三维片上网络因拓扑维度的增加而缩短了通信距离,极大地提升了网络的平均通信性能。本文对比分析了k-ary-2-mesh网络及其对应的三维网络在最差情形下的通信性能...
关键词:三维片上网络 网络演算 延迟上界 性能分析 
Cell处理器上软件缓存的设计与实现被引量:3
《计算机工程》2011年第2期45-47,共3页孙守航 杨灿群 
国家自然科学基金资助重点项目(60633050);国家自然科学基金创新研究群体基金资助项目(60621003)
在Cell异构多核处理器上,并行程序对不规则共享数据的访问延迟较大,共享数据的一致性维护困难。为解决上述问题,提出一种基于扩充Location Consistency存储模型一致性协议的软件缓存。测试结果表明,该软件缓存能够缩短近40%的共享数据...
关键词:CELL处理器 一致性 软件缓存 
Multi-core optimization for conjugate gradient benchmark on heterogeneous processors
《Journal of Central South University》2011年第2期490-498,共9页邓林 窦勇 
Project(2008AA01A201) supported the National High-tech Research and Development Program of China;Projects(60833004, 60633050) supported by the National Natural Science Foundation of China
Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at this prob...
关键词:multi-core processor NAS parallelization CG memory optimization 
扩展双精度浮点并行计算:MPI方法
《计算机工程与科学》2010年第12期98-101,共4页杨灿群 杨学军 易会战 
国家自然科学基金重点资助项目(60633050)
双精度浮点并行计算将不能满足高性能计算领域对计算精度的要求,但是目前还没有高性能的超双精度并行计算的解决方法。基于并行编程语言MPI,本文提出了扩展双精度浮点的并行计算实现方法,并且使用精度敏感的圆周率计算BBP算法验证了该...
关键词:扩展双精度 MPI BBP算法 
基于查表的空间填充曲线映射算法
《国防科技大学学报》2010年第5期75-79,共5页吴国福 窦强 窦文华 
国家自然科学基金资助项目(60633050)
空间填充曲线是进行数据降维处理的典型方法。首先给出对角线空间填充曲线的映射规则,该规则使得在高维情况下存在唯一曲线,并且每一维度上的格点数目不受限制。然后提出等势面的概念,推导出不同等势面上格点数量的递推关系。在此基础上...
关键词:空间填充曲线 对角线 等势面 降维 
Cholesky分解细粒度并行算法被引量:6
《计算机工程与科学》2010年第9期102-106,164,共6页邬贵明 窦勇 王淼 
国家自然科学基金资助项目(60633050,60833004)
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16...
关键词:CHOLESKY分解 细粒度并行 FPGA 
基于高精度乘累加的LU分解加速器的设计被引量:2
《计算机工程与科学》2009年第11期33-36,共4页雷元武 窦勇 郭松 李鑫 雷国庆 
国家自然科学基金资助项目(60633050)
本文首先分析LU分解中舍入误差的积累过程,建立精度损失与矩阵规模的关系模型来预测大规模LU分解的精度;然后,根据定点加法的简单、快速、无精度损失的特点,设计高精度乘累加器(HPMAcc),并基于此实现一个细粒度并行LU分解加速器。实验...
关键词:舍入误差 LU分解 高精度乘累加 
高性能互连网络中的MSFS集成调度算法
《计算机工程》2009年第9期1-3,共3页孙全宝 张民选 肖立权 
国家自然科学基金资助项目"高性能并行计算机体系结构研究"(60633050)
提出最大服务优先(MSFS)的组播调度算法,从减小组播报文在单个路由器上传输延迟的角度出发,根据接收到报文副本的目标端口数和报文在缓存队列头位置的等待时间确定组播报文的优先级。MSFS实现简单,当单播和组播并存时,能够与FCFS单播调...
关键词:互连网络 单播 组播 报文调度 
A coarse-grained reconfigurable computing architecture with loop self-pipelining
《Science in China(Series F)》2009年第4期575-587,共13页DOU Yong WU GuiMing XU dinHui ZHOU XingMing 
Supported by the National Natural Science Foundation of China (Grant No. 60633050, 60621003);the National High Technology Researchand Development Program of China (Grant No. 2007AA01Z06)
Reconfigurable computing tries to achieve the balance between high efficiency of custom computing and flexibility of general-purpose computing. This paper presents the implementation techniques in LEAP, a coarse-grain...
关键词:reconfigurable computing loop pipelining data driven register promotion 
事务存储系统被引量:8
《计算机研究与发展》2009年第8期1386-1398,共13页彭林 谢伦国 张小强 
国家"八六三"高技术研究发展计划基金项目(2008AA01Z110);国家自然科学基金重点项目(60633050)~~
多核处理器性能的发挥依靠程序的并行,共享存储并行编程模型为大多数多核处理器所采用,而有效同步多个线程对共享变量的访问是其关键、也是难题.借鉴数据库中事务的思想,人们提出事务存储(transactional memory),旨在提供一种编程简单,...
关键词:事务存储 多核处理器 共享存储 并行编程 同步 
检索报告 对象比较 聚类工具 使用帮助 返回顶部