众核结构上分块LU分解算法的研究  

Study on blocked LU decomposition on many-core architecture

在线阅读下载全文

作  者:余磊[1,2] 刘志勇[1] 马宜科[1,2] 宋风龙[1] 徐卫志[1,2] 叶笑春[1] 

机构地区:[1]中国科学院计算技术研究所系统结构重点实验室,北京100190 [2]中国科学院研究生院,北京100039

出  处:《高技术通讯》2011年第3期248-253,共6页Chinese High Technology Letters

基  金:863计划(2009AA01Z103)973计划(2005CB321600),国家自然科学基金(60736012,61070025),国家杰出青年科学基金(60925009),国家自然科学基金创新研究群体科学基金(60921002)和北京市自然科学基金(4092044)资助项目.

摘  要:针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和DABP算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性。在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。The authors studied the scientific application LU decomposition deeply, A speedup model for LU decomposition was proposed, and an algorithm for LU decomposition based on bit reverse xor (BRX) was implemented. Then a dynamic absolute balance policy (DABP) algorithm was presented. In order to estimate the algorithms of 2 dimensional (2D) scatter, BRX and DABP, two different estimation functions were given and they were used to estimate the load balance problem of the algorithms. These two functions verify that the DABP algorithm has the best load balance. The simulations of the three algorithms were performed on the many-core architecture Godson-T. The experiments prove that the speedup of the DABP algorithm is 46 and it is the best performance of the three algorithms.

关 键 词:计算机体系结构 众核 加速比 负载均衡 LU分解 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象