秦强

作品数:3被引量:2H指数:1
导出分析报告
供职机构:上海交通大学高性能计算中心更多>>
发文主题:INTELSTENCILIMCIXEONPHI更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与科学》《计算机科学》更多>>
所获基金:国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
使用Stencil评估Intel AVX2 Vgather指令
《计算机科学》2017年第1期20-24,共5页林新华 秦强 李硕 文敏华 松岗聪 
国家重点研发计划(2014AA01A302;2016YFB0201800);日本学术振兴会RONPAKU Fellowship资助
为了更好地在向量化时读取离散的数据,Intel在Haswell CPU提供了AVX2vgather指令。由于Stencil在设置边界条件时使用了条件判断,因此编译器生成了vgather指令,并降低了Stencil在Haswell上的性能。提出使用peel优化或intrinsic load的方...
关键词:AVX2 vgather指令 STENCIL 性能评估 
利用Stencil建模及评估Intel IMCI vgather指令被引量:1
《计算机工程与科学》2016年第9期1741-1747,共7页林新华 王一超 秦强 李硕 文敏华 松岡聡 
国家863计划(2014AA01A302);日本学术振兴会RONPAKU Fellowship资助
Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgathe...
关键词:性能建模 vgather XEON PHI 硬件计数器 
在Intel Knights Corner和NVIDIA Kepler架构上OpenACC的性能可移植性分析被引量:1
《计算机科学》2015年第1期75-78,共4页王一超 秦强 施忠伟 林新华 
OpenACC是一套基于指导语句方式的并行编程语言标准。编程者可以通过在代码中添加符合该标准的指导语句,经OpenACC编译器的编译,将串行代码并行化地移植到加速器或者协处理器上,进而获得异构加速器所带来的加速效果。OpenACC与CUDA和Ope...
关键词:OpenACC 性能可移植性 高性能计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部