国家自然科学基金(61221062)

作品数:11被引量:40H指数:3
导出分析报告
相关作者:汪文祥胡伟武张云泉吴瑞阳李焱更多>>
相关机构:中国科学院中国科学院大学龙芯中科技术有限公司中国科学院软件研究所更多>>
相关期刊:《高技术通讯》《计算机研究与发展》《中国科学:信息科学》《Science China(Information Sciences)》更多>>
相关主题:龙芯处理器缓存一致性二进制翻译架构设计更多>>
相关领域:自动化与计算机技术理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
众核处理器片上网络的层次化全局自适应路由机制被引量:3
《计算机研究与发展》2016年第6期1211-1220,共10页张洋 王达 叶笑春 朱亚涛 范东睿 李宏亮 谢向辉 
国家“九七三”重点基础研究发展计划基金项目(2011CB302501);国家自然科学基金项目(61332009,61173007,61221062);“核高基”国家科技重大专项基金项目(2013ZX0102-8001-001-001);国家“八六三”高技术研究发展计划基金项目(2015AA011204,2012AA010901)~~
Mesh和环拓扑结构以其实现简单、易于扩展的特点成为众核处理器片上网络应用最为广泛的拓扑结构.应用于Mesh结构中的健忘型路由算法在网络流量较大时影响片上网络的负载均衡,表现在降低吞吐量和增大数据包延迟.自适应算法中的本地自适...
关键词:众核处理器 片上网络 负载均衡 全局拥塞信息传播网络 层次化全局自适应路由算法 Roof-Mesh 
基于OpenCL的直方图生成算法优化方法研究被引量:3
《计算机科学》2015年第11期32-36,共5页安小景 张云泉 贾海鹏 
国家自然科学基金(61272136);国家自然科学基金创新群体(61221062)资助
随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式.直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用.随着图像处理规模...
关键词:GPGPU OPENCL 数据本地化 直方图生成 
Automatic tuning of sparse matrix-vector multiplication on multicore clusters被引量:3
《Science China(Information Sciences)》2015年第9期13-26,共14页LI ShiGang HU ChangJun ZHANG JunChao ZHANG YunQuan 
supported by the State Key Program of National Natural Science of China(Grant Nos.61432018,61133005);National Natural Science Foundation of China(Grant No.61272136);Foundation for Innovative Research Groups of the National Natural Science Foundation of China(Grant No.61221062);National Basic Research Program of China(Grant No.2013CB329606)
To have good performance and scalability, parallel applications should be sophisticatedly optimized to exploit intra-node parallelism and reduce inter-node communication on multicore clusters. This paper in- vestigate...
关键词:SpMV PGAS HYBRIDIZATION model-driven multicore clusters 
基于NUMA架构的解释器访存优化设计与实现
《高技术通讯》2015年第7期661-668,共8页任彤 傅杰 靳国杰 
国家“核高基”科技重大专项课题(2009ZX01028-002-003,2009ZX01029-001-003,2010ZX01036-001-002,2012ZX01029-001-002-002,2014ZX01020201);国家自然科学基金(61221062,61133004,61173001,61232009,61222204,61432016);863计划(2012AA010901,2012AA011002,2013AA014301)资助项目
为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案...
关键词:非一致内存访问(NUMA) 虚拟机 解释器 响应速度 启动性能 访存优化 
片上多核处理器的区域共享的双粒度目录
《高技术通讯》2015年第7期669-676,共8页曾露 陈新科 王焕东 
国家“核高基”科技重大专项课题(2009ZX01028-002-003,2009ZX01029-001-003,2010ZX01036-001-002,2012ZX01029-001-002-002);国家自然科学基金(61221062,61100163,61133004,61173001,61232009,61222204);863计划(2012AA010901,2012AA011002,2012AA012202,2013AA014301)资助项目
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用...
关键词:双粒度目录(DGD) 片上多核处理器 缓存一致性 区域共享 目录一致性协议 访存优化 
二进制翻译系统中信号处理机制的研究
《高技术通讯》2015年第6期543-551,共9页远翔 武成岗 王振江 
国家自然科学基金(61303052;61332009;61303051;60925009);国家自然科学基金创新群体(61221062);863计划(2012AA010901);973计划(2011CB302504)资助项目
考虑到用户级二进制翻译(BT)系统需要支持在应用程序特别是多线程程序中广泛使用的信号机制,研究了用户级BT系统中的信号处理问题。详细分析了BT系统在处理信号时存在的各种问题,在此基础上设计了一种新的BT系统执行框架,用以降低用户...
关键词:用户级二进制翻译(BT) 信号处理 多线程框架 信号隔离 
龙芯指令系统融合技术被引量:6
《中国科学:信息科学》2015年第4期459-479,共21页胡伟武 靳国杰 汪文祥 张晓春 王焕东 
国家科技重大专项"核高基"(批准号:2009ZX01028-002-003;2009ZX01029-001-003;2010ZX01036-001-002;2012ZX01029-001-002-002);国家自然科学基金(批准号:61221062;61100163;61133004;61173001;61232009;61222204);国家高技术研究发展计划(863计划)(批准号:2012AA010901;2012AA011002;2012AA012202;2013AA014301)资助
本文介绍了龙芯CPU的指令系统融合技术.龙芯CPU在兼容MIPS指令系统的基础上进行扩充,增加MIPS中不具备但X86和ARM具备的、对二进制翻译影响很大的核心功能,形成龙芯指令系统Loong ISA.在此基础上,通过软硬结合的二进制翻译,在龙芯CPU上...
关键词:龙芯CPU MIPS指令系统 龙芯指令系统 二进制翻译 兼容 软件生态 
龙芯UNCACHE加速原理及其在系统图形性能优化中的应用被引量:2
《高技术通讯》2015年第4期357-364,共8页张爽爽 孟小甫 汪文祥 高翔 
国家“核高基”科技重大专项课题(2009ZX01028-002-003,2009ZX01029-001-003,2012ZX01029-001-002-002,2014ZX01020201);国家自然科学基金(61221062,61232009,61222204,61432016)资助项目
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访...
关键词:处理器核 UA 图形 图像 
龙芯GS464E处理器核架构设计被引量:15
《中国科学:信息科学》2015年第4期480-500,共21页吴瑞阳 汪文祥 王焕东 胡伟武 
国家科技重大专项“核高基”(批准号:2009ZX01028-002-003,2009ZX01029-001-003,2010ZX01036-001-002,2012ZX01029-001-002-002,2014ZX01020201,2014ZX01030101);国家自然科学基金(批准号:61221062,61133004,61173001,61232009,61222204,61432016);国家高技术研究发展计划(863计划)(批准号:2012AA010901,2012AA011002,2013AA014301)资助
龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cach...
关键词:处理器核 多核处理器 分支预测 访存性能 缓存一致性 
数据触发的基本块间弹性控制电路综合方法
《高技术通讯》2015年第1期46-53,共8页黄元杰 陈云霁 吴承勇 
国家自然科学基金(61003064,61221062,61303158);中科院先导专项(XDA06010403)资助项目
研究了面向弹性粗粒度可重构阵列(CGRA)的高级语言综合方法,针对现有方法由于采用逐个执行基本块的方式限制了循环代码性能的问题,提出了一种在内层循环基本块间局部地采用数据触发的新型控制方式。这一新的综合方式在保证正确性的同时...
关键词:可重构处理器 弹性电路 动态调度 数据流控制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部