加速卡

作品数:499被引量:39H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:孙岩赵蓉熊泽宇徐金波陆平静更多>>
相关机构:苏州浪潮智能科技有限公司郑州云海信息技术有限公司中科驭数(北京)科技有限公司浪潮〈北京〉电子信息产业有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中国科学院知识创新工程重要方向项目国家高技术研究发展计划中山市科技计划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于国产加速卡的地震模拟计算性能分析与优化
《防灾减灾工程学报》2025年第1期21-33,共13页周辉 朱虎明 高天琦 董西淼 张凌云 刘卉杰 陈志鹏 
陕西省重点研发计划(2022ZDLGY01-09);光合基金(202302019674);陕西省自然科学基础研究计划(2023-JC-YB-242)资助。
AWP-ODC是基于有限差分数值方法来实现大规模三维地震模拟的软件。随着国外对我国高性能计算芯片的出口限制,我国急需发展自己的高性能计算芯片及其软件生态。早期的AWP-ODC加速主要基于NVIDIA GPU软硬件架构来设计优化,近年来,多种异...
关键词:地震模拟 国产加速卡 AWP-ODC 异构计算 性能优化 
SDAA:面向申威智能加速卡的运行时系统
《软件学报》2024年第12期5710-5724,共15页赵玉龙 张鲁飞 许国春 李宇轩 孙茹君 刘鑫 
国家重点研发计划(2018ZX01028102)。
自主研制的申威智能加速卡上搭载了脉动阵列增强的申威众核处理器,其智能计算能力与主流GPU相当,但仍缺少配套的基础软件.为降低申威智能加速卡的使用门槛,有效支撑人工智能应用开发,设计面向申威智能加速卡的运行时系统SDAA,语义与主流...
关键词:运行时系统 申威智能加速卡 人工智能 软件定义 
面向异构加速卡的MF-DMA设计与实现
《计算机工程与设计》2024年第11期3486-3491,共6页朱兴洪 张振荣 陈奕君 
广西自然科学重点基金项目(2021GXNFDA076001)。
为解决加速卡在异构系统中数据传输带宽低、数据交互方式不灵活的问题,提出一种多功能直接内存访问(multiple functions direct memory access,MF-DMA)架构。采用寄存器配置、存储表和描述符环3种DMA触发方式,适应不同应用数据传输需求...
关键词:可编程逻辑门阵列 异构加速系统 直接内存访问 加速卡 高级扩展接口 高速串行总线 描述符环 
OODAFlow:面向智能无人系统的流式数据处理框架
《高技术通讯》2024年第9期905-920,共16页全振宇 尹龙祥 陈晓明 韩银和 
国家重点研发计划(2022YFB4501600);中国科学院战略性先导科技专项(B类)(XDB44000000);中国科学院计算技术研究所创新课题(E261040)资助项目。
智能无人系统是一种能够在复杂环境中自主进行实时推理、决策和制定行动方案的计算系统。智能无人系统实现实时决策的关键在于对流式数据的实时处理,然而随着人工智能技术和传感器技术的快速发展,智能无人系统需要处理的数据规模不断增...
关键词:智能无人系统 深度学习加速卡 观察-判断-决策-行动(OODA) 流式数据处理框架 异构计算资源 
大气环境污染评估粒子扩散模拟程序计算效率优化研究
《环境科学与管理》2024年第8期45-49,共5页赵多新 吕明华 赵丹 李云鹏 李若洁 
粒子扩散模拟程序是大气环境污染评估中的常用工具,特别是在各类设施应急条件下的环境污染评价工作中使用较为普遍,但由于考虑的物理过程较为复杂,计算效率成为影响使用效果的重要因素。此研究将一个大气环境污染评价模型LPAM的耗时部...
关键词:大气污染环境评价模型 加速卡 移植 
面向国产加速卡的OpenFOAM线程并行加速研究
《数据与计算发展前沿》2024年第2期134-144,共11页尚小敏 李强 高凌云 陶顺安 周全 袁武 陆忠华 
国家重点研发计划(2020YFB1709500);山东省自然科学基金面上项目(ZR201910310143)。
【背景】随着流体力学模拟的精细化,CFD流体模拟软件OpenFOAM对算力的需求持续增加,新型东方超级计算系统是国产自研的新型异构超算。【目的】以新型东方超级计算系统为平台移植OpenFOAM,实现OpenFOAM的国产超算适配与加速。【方法】首...
关键词:OPENFOAM 并行计算 异构计算 国产加速卡 移植优化 
国产DCU加速卡与MPS方法结合高效模拟带障碍物溃坝流动问题被引量:1
《水动力学研究与进展(A辑)》2024年第2期187-195,共9页黄聪祎 赵伟文 万德成 
国家自然科学基金(52131102)。
移动粒子半隐式方法(Moving Particle Semi-implicit, MPS)因其拉格朗日特性而具有独特优势,尤其适合用于模拟具有自由表面大变形特征的强非线性问题。然而,邻居粒子搜索和压力泊松方程求解的高计算开销限制了该方法在大规模应用场景中...
关键词:移动粒子半隐式方法(MPS) 自由表面流动 深度计算单元(DCU) 异构计算 
AMD推出为超低时延电子交易专属打造的基于FPGA的加速卡
《单片机与嵌入式系统应用》2023年第12期96-96,共1页
AMD(超威)推出AMD AlveoUL3524加速卡,这是一款面向超低时延电子交易应用设计的新款金融科技(fintech)加速卡。Alveo UL3524已由领先的交易公司进行了部署,并且支持多种解决方案合作伙伴产品,能够为自营交易商、做市商、对冲基金、经纪...
关键词:电子交易 FPGA平台 AMD 网络连接 对冲基金 收发器 替代方案 经纪商 
基于硬件感知的多目标神经结构搜索方法
《计算机学报》2023年第12期2651-2669,共19页许柯 孟源 杨尚尚 田野 张兴义 
科技部科技创新2030“新一代人工智能”重大项目(2018AAA0100105);国家自然科学基金(U21A20512、62206003)资助。
神经结构搜索技术可以在大量候选网络集合中搜索到适用于特定任务的神经网络结构.目前,大多数结构搜索网络的部署是针对英伟达GPU、英特尔CPU或谷歌TPU等硬件设备的.然而,将搜索到的架构迁移到一些AI专用加速器中,如寒武纪加速卡或华为A...
关键词:图像分类 进化算法 多目标神经结构搜索 硬件感知神经结构搜索 寒武纪加速卡 
AMD推出为超低时延电子交易专属打造的基于FPGA的加速卡
《单片机与嵌入式系统应用》2023年第11期96-96,共1页
AMD(超威)推出AMD Alveo UL3524加速卡,这是一款面向超低时延电子交易应用设计的新款金融科技(fintech)加速卡。Alveo UL3524已由领先的交易公司进行了部署,并且支持多种解决方案合作伙伴产品,能够为自营交易商、做市商、对冲基金、经...
关键词:电子交易 FPGA平台 AMD 网络连接 对冲基金 收发器 替代方案 经纪商 
检索报告 对象比较 聚类工具 使用帮助 返回顶部