黄立波

作品数:22被引量:49H指数:4
导出分析报告
供职机构:国防科学技术大学更多>>
发文主题:寄存器操作数处理器硬件开销微处理器更多>>
发文领域:自动化与计算机技术电子电信理学交通运输工程更多>>
发文期刊:《计算机科学与探索》《小型微型计算机系统》《数学的实践与认识》《前沿科学》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划国防科技大学科研计划项目国防科技大学优秀研究生创新基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
近似乘法器研究综述
《小型微型计算机系统》2025年第2期482-492,共11页李鹏程 黄立波 谭弘兵 杨乾明 刘威 马胜 邓全 王永文 
国家自然科学基金项目(62272475,62172430)资助;湖南省自然科学基金项目(2022JJ10064,2021JJ10052)资助;湖南省科技创新计划项目(2022RC3065)资助;国防科技大学先进微处理器芯片与系统重点实验室支持。
人工智能(AI)和物联网(IoT)的迅速发展,对能效提出了更高的要求.在后摩尔时代,通过牺牲精度以换取高能效的近似计算成为解决资源开销问题的重要方法,其中近似乘法器在容错应用中发挥了关键作用.为促进近似乘法器的相关研究,本文对相关...
关键词:近似乘法器 精度 开销 架构设计 通用优化 
融合多尺度特征表示和注意力机制的步态识别模型
《上海理工大学学报》2024年第6期589-599,共11页曹子康 裴颂文 黄立波 
国家自然科学基金资助项目(61975124);四川省重点研发项目(2024YFFK0443);上海市自然科学基金资助项目(20ZR1438500)。
针对步态识别模型在特征表示粒度和时空依赖建模的不足,提出了一种融合多尺度特征表示和注意力机制的步态识别模型。该模型包含两个关键模块:多尺度特征融合网络(multi-scale features fusion network,MFFN)和步态注意力融合模块(gait a...
关键词:步态识别 多尺度特征 注意力机制 时空依赖 特征融合 
开源GPU研究综述
《小型微型计算机系统》2024年第9期2294-2304,共11页贾珍珍 杨凌 黄立波 郭辉 王勇 刘胜 常俊胜 王永文 
国家自然科学基金项目(62272475,62090023,62102433)资助;湖南省自然科学基金项目(2022JJ10064)资助.
近年来,深度学习、科学计算等需要大量数据并行处理的应用蓬勃发展,高算力GPU愈发受到关注.相比于传统的CPU计算平台,GPU并发高、带宽高,可以大幅提升计算效率.然而,GPU的硬件架构和设计细节通常闭源,且GPU厂商提供的驱动程序也是闭源的...
关键词:开源硬件 GPU 综述 SIMT 
RISC-V特权架构配置的硬件实现影响研究被引量:1
《小型微型计算机系统》2024年第4期1018-1024,共7页闫润 黄立波 成元虎 杨凌 兰孟桥 张京 
国家自然科学基金项目(62090023)资助.
RISC-V指令集的模块化设计,能够适用于从低功耗设备到高性能处理器等多个领域.RISC-V特权架构涵盖了系统中除非特权指令集以外的所有内容,包括特权指令以及运行操作系统和连接外部设备所需的附加功能.基于特权架构,分为32位和64位两类,...
关键词:RISC-V 特权架构 配置性 面积 功耗 微处理器 
面向现代GPU的Winograd卷积加速研究
《电子学报》2024年第1期244-257,共14页童敢 黄立波 吕雅帅 
国家自然科学基金(No.61872374)。
卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,...
关键词:Winograd卷积 低精度 部分计算核融合 卷积加速 GPU内存层级 Tensor Core 
处理器值预测技术研究
《电子学报》2023年第12期3591-3618,共28页黄立波 杨凌 杨乾明 马胜 王永文 隋兵才 沈立 徐炜遐 
国家重点研发计划(No.2021YFB0300300);国家自然科学基金(No.62272475,No.62172430);湖南省自然科学基金(No.2022JJ10064,No.2021JJ10052);湖南省科技创新计划项目(No.2022RC3065)。
当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能...
关键词:值预测 数据依赖 处理器 流水线 存储墙 超标量 
高效多分支预测器设计与实现
《计算机科学与探索》2023年第8期1842-1851,共10页杨凌 周锦文 王京 兰孟桥 丁梓坚 杨实 王永文 黄立波 
国家自然科学基金(61872374,62090023,62272475);湖南省自然科学基金(2022JJ10064)。
分支预测是保证处理器性能的重要技术,尤其在当今广泛应用的超标量处理器中,分支预测器的各项属性极大地影响着处理器的整体性能、功耗和面积。为了在超标量处理器中获得具有较高性价比的分支预测器,尝试使用了TAGE预测器对取指宽度内...
关键词:分支预测 TAGE 嵌入式 超标量 处理器 
实时光线追踪相关研究综述被引量:4
《计算机科学与探索》2023年第2期263-278,共16页闫润 黄立波 郭辉 王永鑫 张鑫铖 张鸿儒 
国家自然科学基金(61872374,62102433)。
光线追踪因其渲染效果的真实性,长期以来被视为下一代主流图像渲染技术,是计算机图形学领域的热点研究方向。近年来,学术界和商业界对实时光线追踪开展了广泛研究。为促进实时光线追踪的研究,对相关文献进行归纳、分析和总结。首先阐述...
关键词:渲染 光线追踪 图形处理器(GPU) 领域定制体系结构 
Winograd快速卷积相关研究综述被引量:5
《计算机科学与探索》2022年第5期959-971,共13页童敢 黄立波 
国家自然科学基金(61872374)。
卷积神经网络(CNN)已经被广泛应用到各个领域并发挥了重要作用。卷积算子是卷积神经网络的基础组件,同时也是最耗时的部分。近年来,研究者提出了包括基于FFT和Winograd的若干种快速卷积算法。其中Winograd卷积因大幅减少了卷积中乘法操...
关键词:Winograd卷积 快速卷积算法 卷积神经网络(CNN) 卷积优化 
基于RISC-V的嵌入式多指令集处理器设计及实现被引量:8
《电子学报》2021年第11期2081-2089,共9页成元虎 黄立波 崔益俊 马胜 王永文 隋兵才 
国家自然科学基金(No.62090023,No.61872374)。
软件生态是限制RISC-V指令集架构发展的主要因素之一.让RISC-V处理器可以直接运行ARM Thumb二进制代码能在一定程度上缓解其在嵌入式领域中的软件生态问题.本文基于二进制翻译,通过硬件支持ARM Thumb的标志位、分支指令、条件执行,在RIS...
关键词:RISC-V ARM Thumb 体系结构 多指令集 微处理器 二进制翻译 
检索报告 对象比较 聚类工具 使用帮助 返回顶部