章隆兵

作品数:60被引量:128H指数:6
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:处理器软件分布式共享存储系统OPENMPJIAJIA软件DSM系统更多>>
发文领域:自动化与计算机技术电子电信理学更多>>
发文期刊:《计算机工程与应用》《电子学报》《计算机研究与发展》《软件学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家科技重大专项更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于无裁剪图形流水线的三维图形处理器被引量:1
《高技术通讯》2024年第7期681-691,共11页赵皓宇 王重熙 宋鹏皓 章隆兵 
国家重点研发计划(2022YFB3105103)资助项目。
传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2.0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采...
关键词:三维图形处理器 图形流水线 裁剪 向量内积 
基于行内局部性的内存控制器端预取
《高技术通讯》2024年第3期248-255,共8页周叔欣 张见齐 王焕东 章隆兵 
国家重点研发计划(2022YFB3105100)资助项目。
本文提出一种基于行内局部性的内存控制器端预取。采用位图的数据结构记录行内每个数据块的状态;并且对每一行进行区域划分,量化每个区域的访问局部性;根据区域内的局部性高低决定预取的激进程度。对于局部性较低的区域,预取区域内未被...
关键词:内存控制器 预取 局部性 
基于功耗计数器的处理器功耗实时估算方法
《高技术通讯》2024年第1期25-32,共8页贾凡 章隆兵 
中国科学院战略性先导科技专项(XDC05020100)资助项目。
针对现有的2类处理器功耗实时估算方法的不足,本文开发了一种基于功耗计数器的处理器功耗实时估算方法。该方法结合了基于性能事件计数器和基于电路信号方法的优点,利用功耗计数器记录与处理器功耗密切相关的电路信号的变化次数,能够以...
关键词:功耗估算 功耗计数器 功耗管理 性能事件计数 LASSO回归 
基于软硬件协同的细粒度安全域隔离机制
《高技术通讯》2024年第1期33-45,共13页李亚伟 章隆兵 王剑 
国家重点研发计划(2022YFB3105104)资助项目。
基于内存篡改的攻击能够恶意地修改程序执行环境的关键数据,给程序提供一个安全可信的执行环境是抑制恶意软件的有效手段。本文提出了一种基于软硬件协同的解决方案,能够以函数调用为粒度,为程序执行提供相对隔离的安全执行环境。为了...
关键词:细粒度 隔离执行 硬件安全 软硬件协同 
面向训练的卷积神经网络加速器设计
《高技术通讯》2023年第6期568-580,共13页杨灿 王重熙 章隆兵 
中国科学院战略性先导科技专项(XDC05020100)资助项目。
随着深度神经网络的广泛应用,对神经网络模型的训练速度需求也不断增长,各类面向训练的加速器应运而生。然而,在训练过程的各阶段,同一个层展现出了巨大的计算差异,计算差异性使得单一数据流结构的加速器在某些阶段的处理上达不到最高...
关键词:神经网络 训练 加速器 卷积神经网络(CNN) 
基于软硬协同的程序运行时安全保护机制被引量:2
《计算机学报》2023年第1期180-201,共22页李亚伟 章隆兵 张福新 王剑 
中国科学院先导课题“桌面处理器软硬件协同性能增强技术(No.XDC05020100)”资助.
内存篡改(Memory Corruption)是现代各类攻击的主要原因,通过修改内存中的数据,达到劫持控制流的目的.使用不安全语言暴露内存细节给开发者,导致很多的敏感数据可以任意被修改.现有的解决方案针对安全攻击主要包括两个方面,软件检查和...
关键词:内存篡改 敏感数据 加解密 运行时保护 
基于社区结构的图数据预取器设计
《高技术通讯》2022年第12期1251-1261,共11页李策 章隆兵 
中国科学院战略性先导科技专项(C类)课题(XDC05020100)资助项目。
由于图数据规模庞大且结构不规则,图应用运行时会产生大量高延迟内存访问,大幅度降低了通用处理器的运行效率。本文采用软硬件结合的方式设计了图计算专用预取器,利用图数据访存特点以及社区结构的存储规律,通过对图数据进行混合预取,...
关键词:图计算 预取器 社区结构 存储规律 及时性 
高性能CPU电源Droop检测优化设计实现
《高技术通讯》2022年第9期894-902,共9页杨丽琼 章隆兵 肖俊华 王剑 
中国科学院战略性先导科技专项(C类)课题(XDC05020100)资助项目。
高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本...
关键词:高性能中央处理器(CPU) 供电检测 Droop Sensor 
基于顶点度数的图数据分区域重排序
《高技术通讯》2022年第9期903-913,共11页李策 章隆兵 
中国科学院战略性先导科技专项(C类)课题(XDC05020100)资助项目。
图计算在机器学习、数据挖掘、网络安全等领域都有着重要应用。而图数据结构不规则且规模巨大,导致访存成为图应用运行时的瓶颈。由于图数据的顶点度数服从幂律分布,许多研究通过重排序图数据使高度数顶点连续储存在相邻位置,从而提升...
关键词:图数据重排序 顶点度数 访存局部性 幂律分布 群落结构 
基于FPGA的浮点可分离卷积神经网络加速方法被引量:2
《高技术通讯》2022年第5期441-453,共13页张志超 王剑 章隆兵 肖俊华 
国家自然科学基金(61432016);国家重点研发计划(2018YFC0832306,2018YFC0831203,2018YFC0831206)资助项目。
针对可分离卷积神经网络在星载飞机目标型号分类应用中存在的速度瓶颈以及功耗限制等问题,提出了一种基于现场可编程门阵列(FPGA)数据流调度的浮点深度分离卷积神经网络加速方法,对通用MobileNet的图像分类模型进行加速。采用基于乘法...
关键词:深度可分离卷积 现场可编程门阵列(FPGA) 数据流调度 加速 图像分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部