检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王家润[1] 谢海峰 WANG Jia-run, XIE Hai-feng(The Third Basic Department, North China Institute of Computing Technology, Beijing 100083, Chin)
机构地区:[1]华北计算技术研究所基础三部,北京100083
出 处:《计算机工程与设计》2018年第6期1774-1781,共8页Computer Engineering and Design
基 金:十三五预研基金项目(31511070401)
摘 要:针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备架构(CUDA)的线程任务分解模型(TTDM),具有线程访问安全(不越界)、计算无冗余(无重复)、计算完整(无遗漏)等特点,具有较好的计算均衡性(负载均衡)。通过国产及商用多环境实验,加速比分别是3.6和5.9,验证了PIDW算法的性能提升能力。To improve performance of domestic application system,the parallel optimized design strategy was proposed based on CPU/GPU multi-core technology.The parallel inverse distance weighting(IDW)optimization algorithms(PIDW)were established to optimize the grid processing of discrete data.To solve the problem of thread task decomposition in parallel programming,thread task decomposition models(TTDM)were designed.Open multi processing(OpenMP)was used and unified device architecture(CUDA)was computed.The models had safety accessing in data bounds,avoiding computing problems of duplication and missing.TTDM had fine computing balancing ability in thread task.Experimental results in domestic and commercial multi environment show that the speedup of the algorithm can reach 3.6 times and 5.9 times respectively,which shows PIDW’s capability to improve performance.
关 键 词:多核技术 离散数据 格网化 线程任务分解模型 反距离权重 开放多核处理 统一计算设备架构
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15