大模型时代网络基础设施的机遇与挑战  

Opportunities and Challenges of Network Infrastructure in the Era of Large Language Models

在线阅读下载全文

作  者:过敏意[1] Guo Minyi

机构地区:[1]上海交通大学计算机科学与工程系,上海200240

出  处:《计算机研究与发展》2024年第11期3663-3663,共1页Journal of Computer Research and Development

摘  要:大模型训练已经成为推动人工智能(AI)和云计算发展的核心驱动力之一,其底层基础设施的性能直接影响训练效率和模型表现.随着大模型规模的不断扩大,数据中心网络的性能需求也在持续提升,尤其是在支持大规模AI模型训练方面,成为未来云计算网络架构演进的重要研究对象.阿里云团队通过深入分析大模型训练中的网络瓶颈和技术挑战,从“网络架构设计、通信感知调度、故障分析定位”3个关键维度进行研究,提出了专为大模型训练设计的网络架构优化方案,实现了大规模训练任务的高效调度和网络传输优化,并在实际系统中取得了显著的性能提升.

关 键 词:网络基础设施 模型训练 数据中心网络 阿里云 云计算 网络瓶颈 高效调度 重要研究对象 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP393.0[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象