检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:过敏意[1] Guo Minyi
机构地区:[1]上海交通大学计算机科学与工程系,上海200240
出 处:《计算机研究与发展》2024年第11期3663-3663,共1页Journal of Computer Research and Development
摘 要:大模型训练已经成为推动人工智能(AI)和云计算发展的核心驱动力之一,其底层基础设施的性能直接影响训练效率和模型表现.随着大模型规模的不断扩大,数据中心网络的性能需求也在持续提升,尤其是在支持大规模AI模型训练方面,成为未来云计算网络架构演进的重要研究对象.阿里云团队通过深入分析大模型训练中的网络瓶颈和技术挑战,从“网络架构设计、通信感知调度、故障分析定位”3个关键维度进行研究,提出了专为大模型训练设计的网络架构优化方案,实现了大规模训练任务的高效调度和网络传输优化,并在实际系统中取得了显著的性能提升.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.127.127