生成式大模型承载网络架构与关键技术探索  被引量:1

Network Architecture and Technologies for Large Generative Models

在线阅读下载全文

作  者:唐宏[1] 武娟[1] 徐晓青 张宁[1] TANG Hong;WU Juan;XU Xiaoqing;ZHANG Ning(Research Institute of China Telecom Company Ltd.,Guangzhou 510630,China)

机构地区:[1]中国电信股份有限公司研究院,广州510630

出  处:《中兴通讯技术》2024年第2期50-55,共6页ZTE Technology Journal

摘  要:生成式大模型训练需要超大规模低时延、高带宽、高可用的网络承载底座。对生成式大模型下高性能网络基础设施的技术发展路线和实现方案进行了研究,认为商用部署时需针对不同训练阶段的工作负载和流量模式,开展定制化网络架构设计和传输协议优化。流控/拥塞控制技术、负载均衡技术、自动化运维技术和面向广域远程直接内存访问(RDMA)的确定性网络传输技术是未来的重点研究方向。The training of large generative models has posed demands for ultra-large-scale,low latency,high bandwidth,and highavailability network infrastructure.The technological development roadmap and implementation schemes of high-performance network in⁃frastructure for large models are investigated.It is believed that the customized network architecture design and transport protocol optimiza⁃tion should be carried out based on workloads and traffic patterns at different training stages during commercial deployment.Flow control/congestion control technologies,load balancing technologies,automated operation and maintenance solutions,and deterministic network transmission technologies for wide-area remote direct memory access(RDMA)are key research directions for the future.

关 键 词:生成式大模型 RDMA 网络拥塞控制 网络负载均衡 

分 类 号:TP393.0[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象