检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:余磊[1,2] 刘志勇[1] 马宜科[1,2] 宋风龙[1] 徐卫志[1,2] 叶笑春[1]
机构地区:[1]中国科学院计算技术研究所系统结构重点实验室,北京100190 [2]中国科学院研究生院,北京100039
出 处:《高技术通讯》2011年第3期248-253,共6页Chinese High Technology Letters
基 金:863计划(2009AA01Z103)973计划(2005CB321600),国家自然科学基金(60736012,61070025),国家杰出青年科学基金(60925009),国家自然科学基金创新研究群体科学基金(60921002)和北京市自然科学基金(4092044)资助项目.
摘 要:针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和DABP算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性。在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。The authors studied the scientific application LU decomposition deeply, A speedup model for LU decomposition was proposed, and an algorithm for LU decomposition based on bit reverse xor (BRX) was implemented. Then a dynamic absolute balance policy (DABP) algorithm was presented. In order to estimate the algorithms of 2 dimensional (2D) scatter, BRX and DABP, two different estimation functions were given and they were used to estimate the load balance problem of the algorithms. These two functions verify that the DABP algorithm has the best load balance. The simulations of the three algorithms were performed on the many-core architecture Godson-T. The experiments prove that the speedup of the DABP algorithm is 46 and it is the best performance of the three algorithms.
关 键 词:计算机体系结构 众核 加速比 负载均衡 LU分解
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.239.180