国家自然科学基金(61272136)

作品数:7被引量:26H指数:3
导出分析报告
相关作者:张云泉贾海鹏袁良李志豪冯晓兵更多>>
相关机构:中国科学院中国科学院大学北京联合大学北京大学更多>>
相关期刊:《计算机学报》《计算机研究与发展》《计算机工程》《Science China(Information Sciences)》更多>>
相关主题:FFT算法FFTCACHE优化矩阵分块V8更多>>
相关领域:自动化与计算机技术理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-7
视图:
排序:
AccSMBO:一种基于超参梯度和元学习的SMBO加速算法被引量:1
《计算机研究与发展》2020年第12期2596-2609,共14页程大宁 张汉平 夏粉 李士刚 袁良 张云泉 
国家自然科学基金项目(61432018,61521092,61272136,61521092,61502450);国家重点研发计划项目(2016YFB0200803);北京自然科学基金项目(L1802053)。
为了利用最佳超参高概率范围和超参梯度,提出了加速的序列模型优化算法(sequential model-based optimization algorithms,SMBO)——AccSMBO算法.AccSMBO使用了具有良好抗噪能力的基于梯度的多核高斯过程回归方法,利用元学习数据集的met...
关键词:AutoML技术 SMBO算法 黑箱调优算法 超参梯度 元学习 并行资源调度 
高性能计算多层次不连续非线性可扩展现象研究被引量:1
《计算机学报》2020年第6期973-989,共17页张云泉 袁良 陈一峯 冯晓兵 张贺 
国家重点研发计划(2016YFB0200803);国家自然科学基金(61432018,61521092,61272136,61402441,61502450)资助.
高性能计算是计算科学的具体实践,极大地促进了各领域的科学进展,也对国家的经济建设起到了无法替代的基础性作用.从几十年发展的时间尺度和十万至百万核量级并行规模尺度研究大规模并行软件的研制发展历史来看,发现大规模并行应用软件...
关键词:高性能计算 超级计算 可扩展性 多层次 不连续 非线性 
基于ARMv8平台的多维FFT实现与优化研究被引量:10
《计算机学报》2019年第11期2384-2402,共19页陈暾 李志豪 贾海鹏 张云泉 
国家重点研发计划(2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金青年基金(61602443);国家自然科学基金重点基金(61272136);国家自然科学基金创新群体(61521092);广东省重大科技专项项目(2015B010108006)资助~~
FFT(快速傅里叶变换)是用于计算离散傅里叶变换(DFT)或其逆运算的快速算法,它广泛应用于工程、科学和数学计算.到目前为止,鲜有基于ARM平台的高性能FFT算法的实现和优化,然而,随着ARMv8处理器应用的日益广泛,研究FFT算法在ARM平台上高...
关键词:ARMv8 FFT算法 FFTW ARMPL SIMD优化 CACHE优化 矩阵分块 
基于ARM V8平台的向量算法库实现与优化被引量:8
《计算机工程》2019年第6期82-88,共7页王晶 张云泉 梁军 
国家重点研发计划(2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金重点项目(61272136);北京市教委科研计划(KM201811417006)
基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8...
关键词:数学函数库 ARMV8架构 向量算法库 单指令流多数据 访存优化 
边缘海静力数值预报模式并行算法研究
《计算机科学》2016年第1期14-17,29,共5页逄仁波 张云泉 谭光明 徐建良 贾海鹏 解庆春 
海洋公益性行业科研专项:海洋渔业安全环境保障服务系统关键技术研究及示范应用(201205006);国家自然科学基金面上项目(61272136);国家自然基金重点基金(61133005);国家自然基金创新群体成员(60921002);中国科学院计算技术研究所创新课题(20136030);中国科学院计算技术研究所计算机体系结构国家重点实验室创新课题(CARCH301)资助
边缘海静力数值模式是国内针对边缘海特点自主开发的数值预报模式,但该模式因物理求解方程较多且采用不宜并行化的SOR求解算法而程序计算时间过长。针对上述问题,提出基于三维网格和海洋模式特点的SOR并行求解算法,该算法在保留三维网...
关键词:数值模式 预报 并行 非阻塞 SOR 
基于OpenCL的直方图生成算法优化方法研究被引量:3
《计算机科学》2015年第11期32-36,共5页安小景 张云泉 贾海鹏 
国家自然科学基金(61272136);国家自然科学基金创新群体(61221062)资助
随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式.直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用.随着图像处理规模...
关键词:GPGPU OPENCL 数据本地化 直方图生成 
Automatic tuning of sparse matrix-vector multiplication on multicore clusters被引量:3
《Science China(Information Sciences)》2015年第9期13-26,共14页LI ShiGang HU ChangJun ZHANG JunChao ZHANG YunQuan 
supported by the State Key Program of National Natural Science of China(Grant Nos.61432018,61133005);National Natural Science Foundation of China(Grant No.61272136);Foundation for Innovative Research Groups of the National Natural Science Foundation of China(Grant No.61221062);National Basic Research Program of China(Grant No.2013CB329606)
To have good performance and scalability, parallel applications should be sophisticatedly optimized to exploit intra-node parallelism and reduce inter-node communication on multicore clusters. This paper in- vestigate...
关键词:SpMV PGAS HYBRIDIZATION model-driven multicore clusters 
检索报告 对象比较 聚类工具 使用帮助 返回顶部