余磊

作品数:4被引量:18H指数:3
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:核结构寄存器处理器计算机体系结构指令级更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《高技术通讯》《计算机学报》《系统仿真学报》更多>>
所获基金:北京市自然科学基金国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
LU分解在众核结构仿真器上的指令级调度研究被引量:5
《系统仿真学报》2011年第12期2603-2610,共8页余磊 刘志勇 宋风龙 叶笑春 
国家“九七三”重点基础研究发展规划项目(2005CB321600);国家自然科学基金重点项目(60736012);国家自然科学基金(61070025);国家“八六三”高技术研究发展计划项目基金(2009AA01Z103);国家杰出青年科学基金(60925009);国际合作欧盟MULTICUBE项目(FP7-216693);北京市自然科学基金(4092044)
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了...
关键词:计算机体系结构 众核 加速比 指令级并行 LU分解 
众核结构上分块LU分解算法的研究
《高技术通讯》2011年第3期248-253,共6页余磊 刘志勇 马宜科 宋风龙 徐卫志 叶笑春 
863计划(2009AA01Z103)973计划(2005CB321600),国家自然科学基金(60736012,61070025),国家杰出青年科学基金(60925009),国家自然科学基金创新研究群体科学基金(60921002)和北京市自然科学基金(4092044)资助项目.
针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和D...
关键词:计算机体系结构 众核 加速比 负载均衡 LU分解 
众核处理器片上同步机制和评估方法研究被引量:10
《计算机学报》2010年第10期1777-1787,共11页徐卫志 宋风龙 刘志勇 范东睿 余磊 张帅 
国家自然科学基金重点项目(60736012);国家"九七三"重点基础研究发展规划项目基金(2005CB321600);国家"八六三"高技术研究发展计划项目基金(2009AA01Z103);国家杰出青年科学基金(60925009);国家自然科学基金创新研究群体科学基金(60921002);北京市自然科学基金(4092044)资助~~
同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制...
关键词:片上众核处理器 同步 硬件支持 量化评估 微程序 
一种片上众核结构共享Cache动态隐式隔离机制研究被引量:3
《计算机学报》2009年第10期1896-1904,共9页宋风龙 刘志勇 范东睿 张军超 余磊 
国家自然科学基金重点项目(60736012);国家"九七三"重点基础研究发展规划项目基金(2005CB321600);国家"八六三"高技术研究发展计划项目基金(2009AA01Z103);北京市自然科学基金(4092044)资助
访存带宽是限制众核处理器性能提升的关键,将片上最后一级Cache设计为所有处理器核共享是必要的.在共享Cache中隔离放置冲突的数据,是提高共享Cache性能的关键.文中提出了缓存块链接的硬件方法,用于隔离共享Cache中不同线程之间的数据....
关键词:众核 共享CACHE 数据冲突 资源隔离 容量划分 
检索报告 对象比较 聚类工具 使用帮助 返回顶部