内存优化

作品数:240被引量:262H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:孙雁飞张丹丹赵鹏亓晋徐远超更多>>
相关机构:努比亚技术有限公司北京航空航天大学中国科学院中国科学院大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家科技支撑计划国家科技重大专项博士研究生创新基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种面向计算图的及时内存重用算法被引量:1
《计算机工程与科学》2024年第9期1539-1546,共8页曹博钧 钱入意 徐远超 
北京市自然科学基金(4212017)。
有限的设备内存容量制约了深度神经网络模型的进一步发展,内存重用是少有的在不引入额外开销的前提下节省内存使用的方法之一。计算图中的中间张量占据着主要的内存空间,是内存重用算法的主要优化对象。现有的典型内存重用算法,包括大...
关键词:计算图 内存优化 内存重用 内存利用率 
基于MLIR的FP8量化模拟与推理内存优化
《计算机科学》2024年第9期112-120,共9页徐金龙 桂中华 李嘉楠 李颖颖 韩林 
2022年河南省重大科技专项(221100210600)。
随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理...
关键词:模型压缩 深度学习编译器 FP8量化 MLIR Yolov5s模型 
地面数字电视覆盖网建设面临的问题及对策
《卫星电视与宽带多媒体》2024年第10期31-33,共3页贾兰杰 
随着新时期社会发展水平的不断提升,数字电视已经成为电视媒体升级和发展的核心成果,本文从提升地面数字电视覆盖网建设质量出发,从理论分析和文献研究的角度入手,对数字电视的普及率和具体的覆盖影响因素展开分析,结合实际案例探讨了...
关键词:地面数字电视 覆盖网建设 内存优化 
基于VPP的高效会话流表研究
《微型计算机》2024年第2期70-72,共3页白雪 杨正敏 李梅茵 
当前很多网络系统或网络设备都通过会话及流表记录跟踪网络流量,并基于会话流表进行管理。对VPP中ACL插件采用的会话流表进行研究,介绍其采用的与常见会话流表处理不同的技术,分析其优缺点,并针对其缺点进行优化及相应验证,优化效果良好。
关键词:会话流表 Bihash 链表 内存优化 VPP 
MACO:基于访存视角的卷积网络自动代码优化
《高技术通讯》2023年第12期1253-1264,共12页张晓扬 肖俊敏 姚家树 谭光明 
国家自然科学基金(62172391,61972377,62032023,T2125013);北京市科技计划(Z231100007423002)资助项目。
推理自动优化一直是人工智能(AI)与系统结构领域交叉的研究重点,但以访存为出发点的自动优化研究方案较少。本文从全局和局部两方面出发,针对数据布局和内核的自动优化问题,以访存的视角对卷积神经网络(CNN)自动代码优化中优化时间成本...
关键词:内存优化 人工智能(AI) 推理 数据布局 自动调优 
面向异质图的在线图划分算法
《计算机系统应用》2023年第12期143-151,共9页赵新朋 罗雄飞 陈楚依 鄢宝彤 乔颖 
中国科学院战略先导C类课题(XDC02030300)。
图划分算法是分布式图计算系统里的重要组成部分,它将一个图划分为若干子图以便在分布式系统中运行,并将子图上的点和边数据及子图上的计算任务分配到各分区.异质图是现实世界中广泛存在的一种图,它是指具有多种节点类型或边类型的图,...
关键词:异质图 图计算 图划分 负载均衡 内存优化 
基于RDMA的高性能单向数据采集技术研究被引量:1
《计算机工程》2023年第10期31-40,共10页梁嘉诚 余江 王洪波 刘渊 王晓锋 
国家自然科学基金(61972182,62172191)。
高性能数据采集技术是提高数据分析效率的重要前提。为解决当前数据采集技术中安全性低、传输时延高、CPU开销大的问题,设计一种基于远程直接内存访问的高性能单向数据采集(ODAR)架构,提高数据采集过程中的安全性和传输性能。针对传输...
关键词:单向数据采集 远程直接内存访问 消息中间件 动态内存优化 数据传输调度 
面向多GPU的图神经网络训练加速被引量:1
《软件学报》2023年第9期4407-4420,共14页苗旭鹏 王驭捷 沈佳 邵蓥侠 崔斌 
国家重点研发计划(2018YFB1004403);国家自然科学基金(61832001,U1936104);北京大学-腾讯协同创新实验室项目;CCF-百度松果基金。
图神经网络由于其强大的表示能力和灵活性最近取得了广泛的关注.随着图数据规模的增长和显存容量的限制,基于传统的通用深度学习系统进行图神经网络训练已经难以满足要求,无法充分发挥GPU设备的性能.如何高效利用GPU硬件进行图神经网络...
关键词:图神经网络 分布式计算 内存优化 GPU加速 
基于分布式数据集的并行计算框架内存优化方法被引量:6
《计算机工程》2023年第4期43-51,共9页夏立斌 刘晓宇 姜晓巍 孙功星 
国家自然科学基金(12275295)。
随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型...
关键词:内存计算 并行计算 内存优化 Spark框架 消息传递接口 
基于MULTIPROG的变量内存分配机制的研究
《技术与市场》2023年第4期83-85,94,共4页韩枫 吴俊博 叶锋 曹建平 曾军 
介绍了一种符合IEC 61131标准的编程软件MULTIPROG的变量内存地址分配原则的测试方法,对简单数据类型、复杂数据类型变量的内存分配机制进行了详细的阐述,进而提出一种通过改变数据的组织方式进行内存优化的方案。
关键词:MULTIPROG 变量地址分配 内存优化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部