贾海鹏

作品数:24被引量:100H指数:5
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:OPENCLGPU跨平台高性能ARM更多>>
发文领域:自动化与计算机技术电子电信更多>>
发文期刊:《计算机科学与探索》《计算机研究与发展》《软件学报》《计算机工程》更多>>
所获基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划广东省重大科技专项更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
小规模非规则TRSM实现与优化
《计算机研究与发展》2025年第2期517-531,共15页郭容园 贾海鹏 张云泉 韦存阳 邓明森 陈婧蕊 周振亚 
国家重点研发计划项目(2023YFB3001701);山西省科技重大专项(202201010101004);国家自然科学基金项目(61972376,62372432,62072431)。
TRSM(triangular matrix equation solver)是线性方程组求解的常用算法,是各种科学计算库和数学软件的核心算法,广泛应用于科学计算、工程计算、机器学习等领域.小规模非规则TRSM算法限定解决问题范围,是高效处理较小规模、非规则数据...
关键词:TRSM算法 BLAS 小规模非规则 SIMD 汇编优化 
基于OpenGL ES的图像滤波算法实现及优化研究被引量:1
《计算机工程》2023年第11期257-266,共10页常文斌 牟明任 贾海鹏 张云泉 张思佳 
国家自然科学基金(61972376,62072431,62032023)。
图像滤波算法广泛应用在机器学习、图像处理、图像识别等领域,在降低椒盐噪声、图像二值化、边缘识别和特征提取等方面发挥着重要作用。现有图像滤波算法虽然在OpenCV开源库中均有实现,但是在Android平台的性能表现与其他平台相比仍存...
关键词:OpenGL ES接口 图像滤波 嵌入式平台 计算着色器 图像纹理 
基于RISC-V的FFmpeg多媒体算法库优化策略被引量:4
《计算机工程》2023年第4期159-165,173,共8页张桢 梁军 贾海鹏 张云泉 李青 
国家自然科学基金(61972376);北京联合大学科研项目(ZK50202002)。
RISC-V处理器的广泛应用使得FFmpeg多媒体算法库在RISC-V平台上的高性能实现日益重要。提出一种基于RISC-V架构的系列优化策略,针对开源音视频多媒体FFmpeg算法库中不同特征和计算密度的算法,利用RISC-V指令集的扩展性对算法库中某些耗...
关键词:开源指令集架构 FFmpeg多媒体算法库 向量化访存 汇编优化 指令流水优化 
基于ARMv8处理器的高性能图像处理算法实现与优化研究被引量:5
《计算机工程与科学》2022年第10期1711-1720,共10页韦存阳 贾海鹏 张云泉 曲国远 魏大洲 张广婷 
国家重点研发计划(2017YFB0202105);国家自然科学基金(61972376);北京自然科学基金(L182053)。
色彩空间转换、图像缩放、图像滤波都是图像处理领域常见的算法,广泛应用于数字媒体、数据通信、生物医学和航空航天等领域。目前上述算法在ARM处理器上虽有开源的OpenCV库,但缺少与Intel IPP库精度相当的高性能图像处理库。为此,根据...
关键词:ARMv8 色彩空间转换 图像插值 图像滤波 
基于ARM的图像几何变换算法库实现和优化技术研究被引量:2
《计算机科学》2022年第10期10-17,共8页王麓涵 贾海鹏 张云泉 张广婷 
国家重点研发计划(2017YFB0202105);国家自然科学基金(61972376);北京市自然科学基金(L182053)。
高性能原语基础算法库(Intel■Integrated Performance Primitives, Intel IPP)是面向信号、图像处理领域的高性能多媒体加速库。然而,截至目前,暂时没有基于ARM架构的高性能IPP库。文中针对镜像变换、重映射、仿射、透视变换等基础图...
关键词:IPP ARM NEON Intrinsic 几何变换 插值 
基于ARM架构的中值滤波算法优化被引量:4
《计算机工程与科学》2022年第10期1738-1746,共9页牟明任 贾海鹏 张云泉 邓明森 曲国远 魏大洲 张广婷 
国家重点研发计划(2017YFB0202105);国家自然科学基金(61972376);北京市自然科学基金(L182053)。
中值滤波是图像处理中降低椒盐噪声的一种有效手段,其核心是计算当前滤波窗口内所有像素的中值。中值滤波具有稳定性,当一幅图像的像素点被改变时,即使改变的值很大,也不会影响中值滤波的计算结果。滤波窗口遍历整幅图像后,就完成了整...
关键词:中值滤波 中值算法 ARM指令集 
面向GPU计算平台的神经网络卷积性能优化被引量:5
《计算机研究与发展》2022年第6期1181-1191,共11页李茂文 曲国远 魏大洲 贾海鹏 
国家重点研发计划项目(2107YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金项目(61972376);北京市自然科学基金项目(L182053)。
图像检测、识别任务已经被应用在越来越多的生产生活场景中,基于卷积神经网络的方法凭借着精度高的特点被广泛应用.但是卷积神经网络存在着权重参数多、对算力要求高的问题,算力有限且型号多样的边缘计算设备使得这些应用在使用中受限....
关键词:通用矩阵乘 Winograd算法 卷积神经网络 性能优化 GPU 
Cooley-Tukey FFT算法高性能实现与优化研究被引量:4
《计算机科学与探索》2022年第6期1304-1315,共12页郭金鑫 张广婷 张云泉 陈泽华 贾海鹏 
国家重点研发计划(2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金(61972376);北京市自然科学基金(L182053)。
快速傅里叶变换(FFT)算法是处理器基础软件生态的重要组成部分,在工程、科学、物理和数学等领域的应用十分广泛,且这些领域对FFT算法的性能也提出了越来越高的要求。研究FFT算法在ARMv8和X86-64上的高性能实现特别是大基高性能的实现,提...
关键词:快速傅里叶变换(FFT) ARMv8 X86-64 FFTW SIMD优化 
基于SIMD的三角函数高性能实现与优化被引量:3
《计算机科学》2021年第12期29-35,共7页姚建宇 张祎维 张广婷 贾海鹏 
国家重点研发计划(2017YFB0202502,2018YFC0809306,2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金(61972376);北京自然科学基金(L182053)。
作为基本的数学运算,三角函数的高性能实现对构建处理器的基础软件生态具有重要意义,特别是当前处理器都采用了SIMD架构,基于SIMD实现高性能三角函数具有重要的研究意义和应用价值。对此,文中采用数值分析的方法,对5个常用的三角函数sin...
关键词:三角函数 SIMD 高性能 数值分析 ARM V8架构 
基于SIMD的Square Root函数高性能实现与优化被引量:2
《计算机工程与科学》2021年第4期662-669,共8页赵永浩 贾海鹏 张云泉 张思佳 
国家重点研发计划(2017YFB0202105,2018YFC0809306,2016YFB0200803,2017YFB0202302);国家自然科学基金(61972376);北京市自然科学基金(L182053)。
在计算机图形学、积分计算和神经网络等应用场景中,平方根函数的高性能实现在构建处理器的基础软件生态中起到了十分重要的作用。随着ARM架构处理器得到广泛的使用,研究ARM架构下的函数快速算法实现变得更加关键。当前大量处理器都采用...
关键词:平方根函数 SIMD 高性能 数值分析 ARM V8架构 
检索报告 对象比较 聚类工具 使用帮助 返回顶部