翟季冬

作品数:15被引量:43H指数:4
导出分析报告
供职机构:清华大学更多>>
发文主题:算子计算装置加速器通信模式存储介质更多>>
发文领域:自动化与计算机技术自然科学总论理学文化科学更多>>
发文期刊:《高性能计算技术》《清华大学学报(自然科学版)》《中兴通讯技术》《大数据》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国防基础科研计划国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
智能算力核心基础系统软件的现状与展望被引量:1
《中兴通讯技术》2024年第2期2-8,共7页郑纬民 翟季冬 翟明书 
智能算力对中国人工智能技术的进步具有重要意义。发展智能算力平台,做好核心基础系统软件尤其重要。梳理了智能算力平台中的10个核心基础系统软件,对这些软件的全球现状进行了详细介绍,并探讨了当前中国算力平台上系统软件栈建设的机...
关键词:人工智能 智能算力 大模型 系统软件 
围炉对谈:性能优化的个性与共性
《计算物理》2024年第1期3-8,共6页莫则尧 王龙 刘杰 谭光明 刘伟峰 喻之斌 翟季冬 杨海龙 徐小文 黄烁 刘洁 
2022年12月12日,第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid(会议网址:http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次,面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战,围绕高性能计算...
关键词:高性能计算 超级计算机 体系结构 中间件技术 性能优化 专家座谈 人才培养 
异步感知的异构高性能计算机性能预测方法
《计算物理》2024年第1期40-51,共12页金煜阳 马子轩 翟季冬 
国家自然科学基金(U20A20226);国家重点研发计划项目(2022YFB4500402)资助。
针对异步策略设计难的问题,提出面向异构超级计算机的高效异步性能预测方法,解耦异步与同步执行的性能,通过层次化建模等技术实现快速精确的性能预测,指导异步策略设计与性能优化。在国产神威异构高性能计算机上,以高性能计算领域典型...
关键词:异构高性能计算机 性能预测 异步策略 
量子计算系统软件研究综述被引量:1
《软件学报》2024年第1期1-18,共18页谢磊 翟季冬 
国家自然科学基金(62225206)。
量子计算理论上有望解决诸多经典难解问题,近年来量子计算机的快速发展正推动这一理论进入实践.然而,当前硬件中繁多的错误会造成计算结果出错,严重限制了量子计算机解决实际问题的能力.量子计算系统软件位于应用与硬件之间,充分挖掘系...
关键词:量子计算 系统软件 嘈杂中规模量子 编译 运行时 调试 
华为昇腾神经网络加速器性能评测与优化被引量:10
《计算机学报》2022年第8期1618-1637,共20页鲁蔚征 张峰 贺寅烜 陈跃国 翟季冬 杜小勇 
国家重点研发计划项目(2018YFB1004401);国家自然科学基金(U1711261,62172419);教育部产学融合协同育人(华为昇腾)项目资助.
华为昇腾是一款新型神经网络加速器.与GPU相比,昇腾加速器专门面向神经网络计算,设计了专用计算单元,核心算力集中在低精度,基于昇腾的软件栈与GPU有所差异.现有研究大多专注于GPU上的深度学习负载性能分析和优化,由于昇腾平台推出不久...
关键词:深度学习 神经网络加速器 华为昇腾 高性能计算 评测基准 
面向新一代神威超级计算机的高效内存分配器被引量:3
《清华大学学报(自然科学版)》2022年第5期943-951,共9页王豪杰 马子轩 郑立言 王元炜 王飞 翟季冬 
国家自然科学基金项目(U20A20226)。
随着应用程序规模的增大,应用程序对计算资源的需求也日益增加,超级计算机为满足这一需求提供了良好的平台。传统的超级计算机主要面向科学计算程序,而近年来应用的多样化对超级计算机的软硬件设计提出了新要求。该文在新一代神威超级...
关键词:内存分配 超级计算机 高性能计算 机器学习 
高效训练百万亿参数预训练模型的系统挑战和对策被引量:6
《中兴通讯技术》2022年第2期51-58,共8页马子轩 翟季冬 韩文弢 陈文光 郑纬民 
随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练...
关键词:人工智能 超级计算机 混合专家 异构系统 
一种面向构件化并行应用程序的性能骨架分析方法被引量:2
《计算机科学》2021年第6期1-9,共9页傅天豪 田鸿运 金煜阳 杨章 翟季冬 武林平 徐小文 
科技部重点研发计划高性能计算重点专项课题(2017YFB0202103);国防基础科研核科学挑战专题项目(TZ2019002)。
性能骨架分析技术通过刻画并行应用程序的程序结构,为并行应用程序性能建模提供输入,是大规模并行应用程序性能分析、性能优化的基础。文中针对数值模拟领域中的一类构件化并行应用程序,在面向通用程序二进制文件的动静态结构分析技术...
关键词:并行计算构件 性能骨架 “构件-循环-调用”关系树 CLCT-STAT 
AIPerf:大规模人工智能算力基准测试程序
《大数据》2021年第3期153-155,共3页翟季冬 
国家自然科学基金资助项目(No.U20A20226)。
随着我国近几年人工智能新基建与大规模计算系统的逐步落地,为了使大规模人工智能计算系统健康持续发展,需要一个能够有效地评价计算系统的人工智能算力的评价指标,而现有的测试方法无法满足这一需求。目前,已有一些大规模计算系统的评...
关键词:人工智能 高性能计算机 大规模计算系统 运算性能 基准测试程序 健康持续发展 测试方法 评价指标 
面向异构融合处理器的性能分析、优化及应用综述被引量:10
《软件学报》2020年第8期2603-2624,共22页张峰 翟季冬 陈政 林甲灶 杜小勇 
国家重点研发计划(2016YFB0200100);国家自然科学基金(61732014,61722208,61802412)。
随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来...
关键词:CPU GPU 异构融合处理器 性能分析 性能优化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部