检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:唐宏[1] 武娟[1] 徐晓青 张宁[1] TANG Hong;WU Juan;XU Xiaoqing;ZHANG Ning(Research Institute of China Telecom Company Ltd.,Guangzhou 510630,China)
机构地区:[1]中国电信股份有限公司研究院,广州510630
出 处:《中兴通讯技术》2024年第2期50-55,共6页ZTE Technology Journal
摘 要:生成式大模型训练需要超大规模低时延、高带宽、高可用的网络承载底座。对生成式大模型下高性能网络基础设施的技术发展路线和实现方案进行了研究,认为商用部署时需针对不同训练阶段的工作负载和流量模式,开展定制化网络架构设计和传输协议优化。流控/拥塞控制技术、负载均衡技术、自动化运维技术和面向广域远程直接内存访问(RDMA)的确定性网络传输技术是未来的重点研究方向。The training of large generative models has posed demands for ultra-large-scale,low latency,high bandwidth,and highavailability network infrastructure.The technological development roadmap and implementation schemes of high-performance network in⁃frastructure for large models are investigated.It is believed that the customized network architecture design and transport protocol optimiza⁃tion should be carried out based on workloads and traffic patterns at different training stages during commercial deployment.Flow control/congestion control technologies,load balancing technologies,automated operation and maintenance solutions,and deterministic network transmission technologies for wide-area remote direct memory access(RDMA)are key research directions for the future.
关 键 词:生成式大模型 RDMA 网络拥塞控制 网络负载均衡
分 类 号:TP393.0[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.23.101.186