国家高技术研究发展计划(2012AA010903)

作品数:24被引量:35H指数:3
导出分析报告
相关作者:李春江杨灿群杜云飞何王全文延华更多>>
相关机构:国防科学技术大学江南计算技术研究所湖南商务职业技术学院微软公司更多>>
相关期刊:《计算机工程与应用》《计算机研究与发展》《计算机学报》《高性能计算技术》更多>>
相关主题:GCCMPIFTGPUINTEL更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于GCC关键变量数据流分析算法的程序切片技术被引量:2
《计算机工程与应用》2017年第24期40-47,54,共9页杨小川 姜军 马晓东 漆锋滨 
国家"863"计划基金资助项目(No.2012AA010903)
随着程序的规模的扩大和复杂度的提高,通过直接分析源码进行程序切片,变得十分困难。在现有的利用编译优化技术来优化程序切片的方法中,存在无法有效利用程序的编译时信息和编译器的优化技术,以及对语言的支持不完善的问题。为此,分析了...
关键词:程序切片 目标函数 关键变量 数据流分析 GIMPLE中间表示 
面向ARM64架构多核微处理器的模板计算性能优化研究被引量:3
《计算机工程与科学》2017年第5期829-833,共5页冯璐霞 李春江 黄亚斌 
国家自然科学基金(61170046);国家863计划(2012AA010903)
模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC...
关键词:模板计算 ARM64 AMCC X-GENE2 FT-1500A 并行化 线程绑定 
基于光子分布概率调整的高效的非匀质半透明材质绘制被引量:1
《计算机辅助设计与图形学学报》2016年第8期1316-1325,共10页黄学真 孙鑫 任重 
国家自然科学基金(61379070);国家"八六三"高技术研究发展计划(2012AA010903)
针对非匀质半透明材质绘制代价高昂的问题,提出一种基于光子分布概率调整的高效非匀质半透明物体绘制算法.首先利用绘制图像所显现的区域生成场景中的关注区域;然后依据体积光子映射算法从光源处随机生成光子并进行跟踪;若光子与关注区...
关键词:半透明材质 次表面散射 光子映射 概率调整 
基于排队理论的动态任务调度模型及容错被引量:1
《计算机研究与发展》2016年第6期1271-1280,共10页何王全 魏迪 权建校 吴伟 漆锋滨 
国家"八六三"高技术研究发展计划基金项目(2012AA010903);计算机体系结构国家重点实验室基金项目(CARCH201403)~~
高效的动态任务调度和容错机制是高性能计算面临的挑战之一,已有的方法难以高效扩展到大规模环境.针对该问题,提出了基于N层排队理论的高可扩展动态任务调度模型,为程序员提供简洁的并行编程框架,有效降低了编程负担;使用泊松过程相关...
关键词:排队理论 动态任务调度 编程框架 容错 轻量级降级 
Intel64体系结构的数据预取机制及效果被引量:1
《计算机科学》2016年第5期34-41,共8页董钰山 李春江 
国家自然科学基金项目:多核多线程处理器SIMD扩展的编程模型及编译优化关键技术研究(61170046);863计划项目:面向国产飞腾处理器的并行程序综合优化系统(2012AA010903)资助
数据预取是为缓解微处理器与DRAM之间速度差异而出现的隐藏访存延迟的方法。当前Intel各系列处理器都采用多种预取机制来加速数据和代码向Cache的移动,从而提升程序的性能。通过对Intel64体系结构存储层次的分析,剖析了X86/X64体系的...
关键词:INTEL 64 CACHE 硬件预取 软件预取 GCC ICC 
基于聚类分析的进程拓扑映射优化被引量:5
《计算机学报》2015年第5期1044-1055,共12页王涛 卿鹏 魏迪 漆锋滨 
国家"八六三"高技术研究发展计划项目基金(2012AA010903)资助~~
高性能计算机系统规模的持续增大使通信墙问题越来越突出.逻辑进程与物理拓扑的映射优化方法能够提高应用的通信效率,已经成为高性能计算的研究热点之一.传统的进程映射优化模型由于映射粒度过细,导致映射效率低,且易破坏通信密集的进...
关键词:通信模式 物理拓扑 进程映射 谱聚类 MPI 
针对小规模整数的MPQS算法
《计算机应用与软件》2015年第4期261-265,308,共6页袁欣辉 漆锋滨 
国家高技术研究发展计划项目(2012A A010903)
数域筛法是目前最有效的大整数分解算法,其中候选关系的光滑性判断需要对大量规模不大的余因子做分解,MPQS作为110-digits以下最快的分解算法得到广泛的应用。但现有的MPQS软件包针对96 bit以下的整数优化不足,未充分挖掘整数规模对MPQ...
关键词:MPQS 筛法 多项式系数 循环拷贝筛 神威 
SPM结构上冗余读延迟写优化的设计与实现
《计算机应用与软件》2015年第2期10-13,共4页文延华 冯冬明 尉红梅 
国家高技术研究发展计划项目(2012AA010903)
随着微处理器架构的发展,将片上SRAM组织成SPM这种软件管理的非cache结构成为众多处理器的选择。SPM结构的特点是实现简单,访问延迟低、带宽高。要有效利用有限的片上SPM空间提升程序性能,必须由用户显式进行数据的布局和传送,或者由编...
关键词:SPM 访存优化 关联性 冗余读延迟写 数据重用 
基于Pthreads的并行DSRC压缩算法设计与实现
《计算机科学》2015年第1期90-91,100,共3页詹科 张云泉 王婷 郑晶晶 张鹏 
国家"八六三"高技术研究发展计划基金(2012AA010903);国家自然科学基金项目(61170075;61133005;61272136;61100073);广州市云计算技术研发与产业化专项资助
高通量测序仪产生大量的DNA数据,FASTQ是被广泛使用的存储DNA数据的数据格式。对FASTQ格式的数据进行压缩处理,能有效地节省存储空间。DSRC算法具有压缩比高的优点,因此对DSRC算法进行并行能提高压缩FASTQ格式的DNA数据的效率。基于Pthr...
关键词:FASTQ 数据压缩 DSRC Pthreads 
基于多层MD5消息摘要的文件完整性实时检测技术被引量:8
《计算机应用与软件》2015年第1期20-23,共4页方燕飞 王俊 何王全 
国家高技术研究发展计划项目(2012AA010903)
在大规模并行系统上,并行应用涉及的文件操作的可靠性和文件数据的完整性验证很重要。基于传统串行MD5摘要的文件验证手段无法满足大规模并行应用的需求,提出一种多层MD5并行摘要思想。基于此实现了文件完整性实时检测接口,并测试了串行...
关键词:MD5消息摘要 文件完整性 实时检测 
检索报告 对象比较 聚类工具 使用帮助 返回顶部