一种面向不可靠网络的快速RDMA通信方法  被引量:2

A Fast RDMA Offload Method for Unreliable Interconnection Networks

在线阅读下载全文

作  者:王绍刚[1] 徐炜遐[1] 吴丹[1] 庞征斌[1] 夏军[1] 

机构地区:[1]国防科学技术大学计算机学院,湖南长沙410073

出  处:《湖南大学学报(自然科学版)》2015年第8期100-107,共8页Journal of Hunan University:Natural Sciences

基  金:国家自然科学基金资助项目(61202024;61202126)~~

摘  要:大数据量的远程内存访问(RDMA)传输是并行计算机中最基本的通信模式之一,对系统整体性能的影响很大.随着并行计算机系统的规模扩大,系统的容错性设计面临着很大的挑战,互连网络具有链路不可靠、自适应路由等特点,如何面向不可靠网络实现可靠的端到端RDMA传输是并行系统体系结构设计的一大难题.提出一种面向不可靠网络下的快速RDMA传输方法,方法能够在节点控制器芯片上高效实现,对上层驱动软件和应用提供可靠的端到端RDMA传输服务.与传统的建立连接的方法相比,方法的硬件设计复杂度大大降低;方法另一优点是实现了按需重传,避免了传统方法中一次RDMA传输出现错误时,需要重传整个RDMA数据的开销,在相同的错误概率下,新方法的传输效率得到了很大的提升.Large data RDMA (Remote Data Memory Access)transport is the most commonly used par-allel communication mode for parallel computers,which has great impact on the whole system perform-ance.As the system size increases,the fault-tolerate architecture design faces new challenges.The inter-connection network usually uses the adaptive routing mode and becomes more unreliable.This paper pro-posed a fast RDMA offload method for unreliable interconnection networks,which can be efficiently imple-mented on the NIC hardware and provides reliable RDMA communication for upper driver and programs. Compared with the traditional approaches,the hardware overhead is greatly reduced.Another benefit is that it can partially retransmit the fault data,which greatly reduces the whole RDMA delay.Simulation results show that the RDMA delay is greatly reduced,compared with the traditional methods.

关 键 词:远程内存访问 RDMA MPI 滑动窗口 

分 类 号:TP302.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象