Cholesky分解细粒度并行算法  被引量:6

A Fine-Grained Parallel Algorithm for the Cholesky Decomposition

在线阅读下载全文

作  者:邬贵明[1] 窦勇[1] 王淼[1] 

机构地区:[1]国防科学技术大学计算机学院。湖南长沙410073

出  处:《计算机工程与科学》2010年第9期102-106,164,共6页Computer Engineering & Science

基  金:国家自然科学基金资助项目(60633050,60833004)

摘  要:本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。This paper presents a fine-grained pipeline parallel algorithm for the Cholesky decomposition,which is applicable to the matrices of arbitrary orders and can exploit fine-grained parallelism of the FPGA accelerators. The experimental results show this algorithm has good scalability. 36 processing elements (PEs) can be integrated into a Xilinx XC5VLX330 FPGA,achieving a performance of 14.3 Gflops when the matrix order is 16 384 at the clock speed of 200 MHz.

关 键 词:CHOLESKY分解 细粒度并行 FPGA 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象