细粒度并行

作品数:38被引量:177H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:窦勇郭磊王智广陈颖孙凝晖更多>>
相关机构:国防科学技术大学中国科学院大连理工大学中国石油大学(北京)更多>>
相关期刊:《微电子学与计算机》《中国科学院大学学报(中英文)》《西安交通大学学报》《中国电子商情(通信市场)》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金国家重点实验室开放基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于异构硬件的LSTM训练系统
《大数据》2024年第4期172-188,共17页黄为新 胡伟方 曹雪娇 石宣化 
新一代人工智能国家科技重大专项(No.2020AAA0108501);湖北省重大攻关项目(JD)(No.2023BAA024)。
在大数据时代,以LSTM为代表的深度神经网络模型具有处理海量数据的能力,在语言处理、语音识别、时序数据预测等领域表现优异。随着模型复杂度的提高,训练成本大幅提升。现有的LSTM训练系统使用了算子融合、多流等加速手段,但忽略了训练...
关键词:LSTM 训练加速 细粒度并行 多流调度 
新能源电力系统细粒度并行与多速率电磁暂态仿真被引量:3
《电力系统自动化》2024年第3期113-121,共9页王啟国 徐晋 汪可友 周建其 樊涛 
国家重点研发计划资助项目(2022YFE0105200)。
随着可再生能源的快速发展,电力系统设备类型越来越多,系统振荡特征越来越复杂,对电磁暂态仿真的精度和效率提出了更高要求。基于大规模集成电路设计中所使用的延迟插入法(LIM),提出了新能源电力系统的细粒度建模方法,并结合图形处理器(...
关键词:可再生能源 电力系统 电磁暂态仿真 并行计算 细粒度仿真 多速率仿真 延迟插入法 图形处理器 
紧耦合异构线程处理器
《高技术通讯》2023年第2期113-123,共11页李文青 齐寒 肖子原 朱威浦 王剑 
中国科学院战略性先导科技专项(XDC05020100)资助项目。
异构计算为系统达到更高的性能功耗比提供了新的思路和方向,但异构系统中中央处理器(CPU)和加速器协同执行任务的过程中大量的控制信号传输和数据搬运始终是系统性能的一个重要瓶颈。对此,本文提出了一种紧耦合异构线程处理器结构,包括...
关键词:异构计算 异构接口 紧耦合 通信 细粒度并行 
基于分块延迟插入法的三相输电网络细粒度并行化电磁暂态仿真被引量:4
《中国电机工程学报》2022年第7期2577-2587,共11页陈蔚然 徐晋 汪可友 李国杰 王啟国 
国家自然科学基金面上项目(51877133);中国博士后科学基金面上项目(2020M671122);博士后创新人才支持计划(BX20200221)。
随着电力系统规模增大,为了适应电力系统电磁暂态仿真对计算速度与准确性的要求,提出一种基于分块延迟插入法的输电网络细粒度并行化电磁暂态仿真方法。该算法充分考虑了输电网络中耦合器件的特性,并对节点电压,支路电流的更新操作采用...
关键词:分块延迟插入法 电磁暂态仿真 图形处理器 全局细粒度并行 
基于PMVS算法的大规模数据细粒度并行优化方法被引量:4
《武汉大学学报(信息科学版)》2019年第4期608-616,共9页刘金硕 李扬眉 江庄毅 邓娟 眭海刚 Pan Jeff 
国家自然科学基金(61672393;U1536204)~~
三维多视角立体视觉算法(patch-based multi-view stereo, PMVS)以其良好的三维重建效果广泛应用于数字城市等领域,但用于大规模计算时算法的执行效率低下。针对此,提出了一种细粒度并行优化方法,从任务划分和负载均衡、主系统存储和GP...
关键词:CPUs_GPUs多粒度并行 GPU并行优化 CUDA 负载均衡 存储与通信优化 图像处理 
面向流体机械仿真的层次化并行计算模型被引量:1
《西安交通大学学报》2019年第2期121-127,共7页肖兮 刘闯 何锋 张琼 张兴军 董小社 
国家"十三五"重点研发计划资助项目(2016YFB0200902);国家自然科学基金资助项目(61572394)
随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真...
关键词:流体机械 粗粒度并行 细粒度并行 并行计算模型 
H.265帧内模式判决并行计算方法研究与实现被引量:2
《小型微型计算机系统》2018年第11期2523-2527,共5页李申 柴志雷 严伟 夏珺 赵建斌 
国家重点研发计划专项(2016YFC0801001)资助;数学工程与先进计算国家重点实验室开放基金项目(2017A08)资助
针对H.265帧内编码算法编码速度慢的问题,基于现场可编程逻辑门阵列(FPGA)设计了一种并行帧内模式判决架构.首先通过理论推导,证明可以将多层次多尺度编码块的模式判决问题转化为单一层次多个小尺度编码块模式判决的叠加问题;其次,在编...
关键词:视频编码 FPGA 模式判决 编码块叠加 细粒度并行 
基于多核的细粒度并行的集合相似连接被引量:1
《计算机学报》2017年第10期2320-2337,共18页荣垂田 李银银 冯林静 汪剑鸣 
国家自然科学基金(61402329;61373104);国家留学基金委资助~~
相似连接是指在给定的两个数据集中,根据给定的相似性度量函数来计算数据之间的相似度,并找出所有相似度不小于给定阈值的数据对的操作.相似连接作为一个基本的操作,被广泛地应用于各种领域.随着网络和移动应用等信息技术的不断发展,数...
关键词:相似连接 并行 多核 多线程 数据划分 
基于GPU的大规模配电网电磁暂态并行仿真技术被引量:17
《电力系统自动化》2017年第19期82-88,共7页陈颖 宋炎侃 黄少伟 于智同 魏巍 
国家自然科学基金资助项目(51477081)~~
随着分布式电源等复杂设备的接入,针对配电网暂态过程的分析逐步依赖详细建模和电磁暂态仿真。图形处理器(GPU)等细粒度并行计算设备可显著提升配电网的电磁暂态仿真效率。提出了一种基于GPU的并行仿真技术,在GPU中加速了对大规模配电...
关键词:配电网 电磁暂态仿真 细粒度并行 图形处理器 
一种面向微电网实时仿真的分块分层并行算法被引量:4
《电工技术学报》2017年第7期104-111,共8页王潇 张炳达 乔平 
国家自然科学基金项目(51477114);天津市科技计划项目(13TXSYJC40400)资助
微电网含有大量的高频功率开关和非线性元件,对电力系统实时仿真技术提出了很高的要求。为减轻逆矩阵法的存储压力,将整个网络分解成多个子网络,仅存储计算子网络状态变量和输出变量的各种参数。为降低子网络间约束方程的计算成本,利用...
关键词:微电网 实时仿真 多端口网络 分层合并 细粒度并行 
检索报告 对象比较 聚类工具 使用帮助 返回顶部