初探通讯带宽和延迟对CUDA程序的影响  

Investigating the Latency and Bandwidth Impact of CUDA Applications

在线阅读下载全文

作  者:周威[1] 姚建华[1] 

机构地区:[1]江南计算技术研究所,无锡214000

出  处:《高性能计算技术》2010年第5期55-59,共5页

摘  要:CUDA是一种新的面向GPU众核的并行编程模型。本文测试了在不同通讯带宽和延迟的情况下,CUDA应用程序的执行性能。试验中使用了Ocelot和NFinSim模拟器,模拟了三种不同架构的GPU配置以及不同的通讯带宽和延迟,分别进行Parboil基准测试,发现通讯带宽和延迟对这些应用的影响都非常小。CUDA applications represent a new body of parallel programs. This paper explores the scalability of CUDA applications on systems with varying interconnect bandwidth and latencies. We use a combination of the Ocelot PTX emulator and NFinSim simulator to evaluate the UIUC Parboil benchmarks on three distinct GPU configurations. We find that these applications are sensitive to neither interconnect latency nor bandwidth.

关 键 词:CUDA GPU 带宽 延迟 

分 类 号:TP316[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象