程序并行化

作品数:20被引量:47H指数:2
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张磊朱传琪康继昌黄清南张国新更多>>
相关机构:中国科学技术大学西北工业大学解放军信息工程大学中国水利水电科学研究院更多>>
相关期刊:《软件学报》《计算机工程》《计算机应用》《计算物理》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金河南省杰出人才创新基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于申威SIMD指令的H.264编码优化被引量:2
《现代电子技术》2024年第6期49-54,共6页黄朴 刘世巍 张昊 王聪 
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM...
关键词:单指令流多数据流 H.264标准 申威处理器 热点函数 程序并行化 细粒度 
自由表面水流数值模拟程序并行化的预处理被引量:2
《水动力学研究与进展(A辑)》2023年第2期222-231,共10页李兴 魏清福 张景新 
国家重点研发计划(2019YFB1503700)。
并行化计算作为一种提升计算速度的手段被广泛应用于计算流体力学领域。为提升模拟速度,以及针对天然水域超大空间和时间尺度的CFD数值模拟需求,实现多节点分布式并行化计算很有必要。MPI作为目前较为成熟的并行接口是软件并行化的优先...
关键词:MPI 并行计算预处理 数据通讯 自由表面水动力学模拟 
面向多面体模型的静态控制块识别扩展方法
《计算机应用与软件》2022年第3期19-24,共6页夏文博 胡伟方 郭浩然 
郑州大学2018年科研启动基金项目(38879938)。
在编译优化中,多面体模型可以对计算密集型程序中的耗时较多的循环代码进行并行性和数据局部性优化。但是,多面体建模过程中存在诸多限制,程序中只有少量代码可以被识别进而转换为多面体表示进行优化。基于LLVM编译框架提出一种分析方法...
关键词:程序并行化 循环优化 多面体模型 LLVM 静态控制块 
基于人工智能搜索和数据依赖分析的程序并行化被引量:1
《现代电子技术》2013年第6期1-3,共3页王磊 曲卫平 李敬兆 
国家自然科学基金(61170060);安徽省自然科学基金(11040606M135);安徽省高等学校自然科学基金重点项目(KJ2011A083);淮南市科技计划项目(2011A07904)
主要研究了自动并行化中的前端分析技术,引入了人工智能搜索方法,并且对其进行改进,实现了在评估函数支持下进行广度和深度搜索的方法。在前端分析的基础上探讨了传统的数据依赖分析方法,针对其不足之处出现的数组数据流分析技术,对其...
关键词:程序并行化 人工智能搜索 评估函数 数据依赖关系 
基于多核系统的视频特征提取程序并行化及性能优化方法(英文)被引量:1
《中国科学院研究生院学报》2011年第4期531-547,共17页张琦 陈玉荣 李建国 胡云 许胤龙 
Supported by the National Natural Science Foundation of China(61073038)
基于多核系统,对4种视频特征的提取程序分别研究了并行算法和性能优化方法.实验结果表明,通过的并行化和性能优化,当使用8个核时,这4种视频特征提取程序的处理速度平均提高到原始串行程序的17倍.此外,对实验结果进行了深入的性能分析,...
关键词:程序性能优化 多核系统 视频特征提取 
外刊速递
《程序员》2011年第2期8-8,共1页
桌面上的并行 计算机行业正在经历一个重大转变:因为发热问题,通过更高的时钟频率提高单个处理器的性能已面临技术的极限。幸运的是,摩尔定律仍然有效,所以芯片制造商使用晶体管通过并行提高多,众核处理器的性能。然而,这需要并...
关键词:并行编程 桌面应用 计算机行业 芯片制造商 程序并行化 多媒体处理 处理器 发热问题 
程序并行化中基于暴露集生成数据分布代码
《计算机工程与设计》2009年第15期3573-3576,共4页丁锐 赵荣彩 韩林 
国家863高技术研究发展计划基金项目(2006AA01Z408)
在并行化编译中,代码生成属于编译器的后端,决定着并行程序的执行效率。数据划分将计算循环中被重定义或没被读引用的数据映射到处理器,按照数据划分生成通信代码会产生冗余通信。提出了利用数组数据流分析求解暴露集,并建立计算划分、...
关键词:并行编译 代码生成 暴露集 不等式系统 通信优化 
光线跟踪程序PBRT的并行化及性能优化
《计算机技术与发展》2008年第10期5-8,12,共5页付雄 王汝传 
国家自然科学基金(60573143;60773041);江苏省高技术研究计划(BG2006001);国家高科技863项目(2006AA01Z201;2006AA01Z219;2006AA01Z439;2007AA01Z404;2007AA01Z479);南京市高科技项目(2007软资106;2007软资127);现代通信国家重点实验室基金(9140C1101010603);江苏省计算机信息处理技术重点实验室基金(kjs06006)
随着多核处理器的出现和迅速发展,将以前经典的串行程序并行化,更好地利用多核体系结构提高其性能,成为了当前多核处理器应用研究值得关注的一个问题。以并行化光线跟踪程序PBRT为例,深入研究了串行程序并行化中的并行模型的设计与实现...
关键词:多核体系结构 程序并行化 光线跟踪 
程序并行化中数据收集代码自动生成算法研究被引量:1
《计算机应用》2006年第10期2473-2475,共3页龚雪容 生拥宏 沈亚楠 
河南省杰出人才创新基金资助项目(0521000200)
着重论述了串行程序并行化过程中的数据收集部分代码的自动生成。提出利用等价类的方法获取数据的最后写关系,并建立包括计算划分、循环迭代和数据最后写关系的不等式限制系统,最后利用FME消元法对不等式限制系统进行消元处理,最终实现...
关键词:并行编译 等价类 数据收集 不等式系统 
二维等离子体并行PIC模拟的性能分析及应用
《计算物理》2005年第3期264-270,共7页陆全明 窦贤康 王水 王曙 
国家自然科学基金(40084001;40174041;4024406);中国科学院知识创新工程重要方向(KZCX2 SW 136);博士点基金资助项目
 通过区域分解法实现了二维等离子体粒子模拟程序并行化,并将此程序运行在由16个PentiumⅢ1 6GCPU组成的微机机群上,对其性能进行了测试.结果表明,在计算规模一定的情况下,并行程序的并行效率随计算结点的增加而降低;而在计算节点不变...
关键词:等离子体 PIC模拟 性能分析 二维 PENTIUM 应用 束流不稳定性 并行效率 程序并行化 区域分解法 粒子模拟 程序运行 并行程序 计算节点 程序计算 物理问题 并行计算 磁场方向 共振条件 CPU 规模 增长阶 激发 波数 频率 波动 
检索报告 对象比较 聚类工具 使用帮助 返回顶部