异构

作品数:12454被引量:29546H指数:41
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈前斌马彬李建东张平朱洪波更多>>
相关机构:北京邮电大学西安电子科技大学中国科学院重庆邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机研究与发展x
条 记 录,以下是1-10
视图:
排序:
大语言模型推理中的存储优化技术综述
《计算机研究与发展》2025年第3期545-562,共18页葛旭冉 欧洋 王博 赵宇 吴利舟 王子聪 陈志广 肖侬 
国家自然科学基金项目(62272499,62332021);国家重点研发计划项目(2022YFB4500304);广东省基础与应用基础研究重大项目(2019B030302002);广东省高层次人才培养专项支持计划项目(2021TQ06X160);琶洲实验室项目(PZL2023KF0001)。
近年来,大语言模型在多个领域展现出卓越的性能,显著改变了人类的生活方式.然而,随着模型规模的不断增长和用户对长上下文推理需求的增加,大语言模型推理系统在存储方面面临诸多问题.首先,庞大的模型参数和键值缓存导致GPU显存资源不足...
关键词:大语言模型推理系统 显存管理 异构存储 分布式存储 故障恢复 无服务大语言模型推理 
ChipletNP:基于芯粒的敏捷可定制网络处理器架构
《计算机研究与发展》2024年第12期2952-2968,共17页李韬 杨惠 厉俊男 刘汝霖 孙志刚 
国家自然科学基金项目(62002368)。
5G,8K视频等新业务类型不断涌现,使得网络处理器(network processor,NP)的应用场景日趋复杂多样.为满足多样化网络应用在性能、灵活性以及服务质量保证等方面的差异化需求,传统NP试图在片上系统(system on chip,SoC)上集成大量处理器核...
关键词:网络处理器 芯粒技术 敏捷交换 分组处理 异构资源 
面向立体化异构网络的智融协同传输方法
《计算机研究与发展》2024年第11期3693-3705,共13页季翔 许长桥 张宏科 
国家杰出青年科学基金项目(62225105);国家自然科学基金重大项目(62394323)。
为应对空天地立体化异构网络中由于节点异构性及连通变化带来的复杂挑战,提出了具备有界无环无阻策略更新能力的传输控制方法HWCTC.该方法以跨层协同控制的方式将网络路由算法引入传输控制框架;在此基础上将路由更新节点的选择问题建模...
关键词:传输控制 空天地立体化异构网络 路由更新 智融标识网络 拥塞控制机制 
容错深度学习加速器跨层优化
《计算机研究与发展》2024年第6期1370-1387,共18页张青 刘成 刘波 黄海同 王颖 李华伟 李晓维 
国家重点研发计划(2022YFB4500405);国家自然科学基金项目(62174162);空间可信计算与电子信息技术实验室开放基金资助(OBCandETL-2022-07)。
容错深度学习加速器是保障高可靠深度学习的基石,也是深度学习应用于安全关键领域如宇航、机器人等面临的一个关键环节.然而,深度学习计算和访存都非常密集,传统基于冗余计算的容错方法直接应用于深度学习加速器的容错设计会导致严重的...
关键词:跨层优化 容错深度学习加速器 脆弱因子 异构架构 选择性冗余 
Direct xPU:一种新型节点间通信优化的分布式异构计算架构被引量:1
《计算机研究与发展》2024年第6期1388-1400,共13页李仁刚 王彦伟 郝锐 肖麟阁 杨乐 杨广文 阚宏伟 
广东省重点领域研发计划项目(2021B0101400001)。
人工智能大模型应用的爆发式增长,使得难以依靠单一节点、单一类型的算力实现应用的规模部署,分布式异构计算成为主流选择,而节点间通信成为大模型训练或推理过程中的主要瓶颈之一.目前,主要由GPU,FPGA等头部芯片厂商所主导的各种计算...
关键词:节点间通信 FPGA GPU RDMA 零拷贝 
面向申威众核处理器的规则处理优化技术
《计算机研究与发展》2024年第1期66-85,共20页张振东 王彤 刘鹏 
数学工程与先进计算国家重点实验室开放基金项目(2020A11,2017A07);之江实验室科研攻关项目(2021PB0AC02)。
高性能口令恢复系统是申威众核处理器的重要应用场景之一,规则处理是主流口令恢复工具中被广泛应用的一种口令生成方式.现有相关研究工作缺少对规则处理算法的优化,导致申威处理器上基于规则的口令生成速度成为口令恢复系统的性能瓶颈....
关键词:申威众核处理器 口令恢复 规则处理 异构计算 单指令多数据流 
前言
《计算机研究与发展》2023年第10期2191-2192,共2页秦志光 张玉清 熊虎 
物联网技术的广泛应用对促进社会经济绿色、智能、可持续发展起着至关重要的作用,成为了国家数字化关键基础设施中不可或缺的组成部分.然而,物联网终端数量庞大、异构性强、拓扑多变、应用环境复杂等特性,导致其面临的安全威胁日益严峻.
关键词:关键基础设施 安全威胁 异构性 应用环境 物联网技术 可持续发展 物联网终端 数字化 
一种可动态配置的分布式内存池缓存一致性机制被引量:2
《计算机研究与发展》2023年第9期1960-1972,共13页段卓辉 刘海坤 赵金玮 刘一航 廖小飞 金海 
国家重点研发计划项目(2022YFB4500303);国家自然科学基金项目(62072198,61825202,61929103)。
在分布式内存系统中,缓存是减少远端内存访问开销的一种有效手段.然而,单一的缓存一致性保证机制往往不能高效适配不同类型负载的访存特性.为此,面向分布式异构内存池系统,设计了基于目录和基于广播相结合的混合缓存一致性保证机制.利...
关键词:分布式异构内存池 分布式缓存机制 分布式一致性协议 基于目录的缓存一致性 基于广播的缓存一致性 
面向GPU集群的动态资源调度方法被引量:4
《计算机研究与发展》2023年第6期1308-1321,共14页傅懋钟 胡海洋 李忠金 
浙江省自然科学基金项目(LY22F020021);浙江省重点研发计划“领雁”项目(2023C01145);国家自然科学基金项目(61802095,61572162)。
深度神经网络(deep neural network,DNN)已广泛应用于人类社会的许多领域.大规模的DNN模型可显著提高识别精度,然而在单个GPU设备上训练大规模的DNN模型需要耗费大量的时间.因此,如何借助分布式深度学习(distributed deep learning,DDL...
关键词:资源调度 GPU集群 分布式深度学习 异构带宽 资源迁移 
异构多核全局限制性可抢占并行任务可调度分析被引量:1
《计算机研究与发展》2023年第5期992-1001,共10页韩美灵 孙施宁 邓庆绪 
国家自然科学基金项目(62002173,62072085);南京邮电大学引进人才自然科学研究启动基金项目(NY219167)。
异构多核平台可以利用不同类别体系结构的处理器来执行特定任务,从而达到提高性能和降低功耗的目的.然而,向大规模异构平台迁移极其困难,且大规模的、必要的程序并行会导致软件调度的复杂度.虽然,基于有向无环图(directed acyclic graph...
关键词:响应时间分析 异构多核 并行任务模型 嵌入式实时系统 可调度性分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部