NVIDIA推出Spectrum-XGS以太网,用于AI超级工厂的连接

科学技术

【免责声明】 本文是基于外部来源的信息重新整理的。请在参考本文内容前核实原始来源。

新闻摘要

以下内容已在网上发布。下面提供了翻译摘要。详情请参见原文。

英伟达在2025年8月宣布的Spectrum-X以太网平台中推出了Spectrum-XGS以太网技术。这种创新的网络解决方案旨在将多个地理分散的数据中心连接成统一的千亿级AI超级工厂。与现成的以太网相比,Spectrum-XGS以太网提供了1.6倍的带宽密度和低延迟,实现了”跨越式”网络,克服了传统局限性。其主要特点包括先进的距离感知拥塞控制、精确的延迟管理和端到端遥测,这些特性使得NVIDIA的集体通信库(NCCL)在分布式数据中心的多GPU和多节点AI工作负载中的性能提高了近一倍。该技术支持SONiC等开放式以太网协议栈,并与NVIDIA的Spectrum-X交换机和ConnectX-8 SuperNIC相集成。CoreWeave已确认为早期采用者,实施Spectrum-XGS以太网将其数据中心互联为统一的AI超级计算机。该技术现已作为NVIDIA Spectrum-X以太网平台的一部分提供,为AI和高性能计算环境的网络能力带来了重大飞跃。

来源: NVIDIA

本站解析

背景和环境

Background and Context illustration

英伟达推出Spectrum-XGS以太网技术标志着数据中心网络技术取得了重大进步,专门针对大规模AI计算的需求。这一发展恰逢AI行业快速扩张,需要日益复杂的基础设施来支持分布式的工作负载。将地理分散的数据中心连接成统一的超级工厂,满足了AI生态系统中的关键需求,提升了跨越广阔距离的计算能力和效率。

专家分析

Spectrum-XGS以太网的功能标志着网络技术在AI应用中取得了重大进步。带宽密度提高1.6倍,NCCL在跨数据中心环境中的性能提高近一倍,体现了英伟达致力于推动AI基础设施极限的决心。集成了诸如距离感知拥塞控制和精确延迟管理等先进功能,解决了分布式计算中的关键挑战,有望彻底改变大规模AI模型的训练和部署方式。

关键要点:

  • 实现”跨越式”网络,连接遍布城市、国家和大陆的数据中心
  • 提供比传统以太网高1.6倍的带宽密度
  • 在跨数据中心环境中提供1.9倍的NCCL性能

补充数据和事实

早期采用者实施Spectrum-XGS以太网提供了其潜力的实际验证:

  • CoreWeave已实施Spectrum-XGS以太网,将其数据中心连接为统一的AI超级计算机
  • xAI使用NVIDIA Spectrum-X以太网网络,包括Spectrum-X交换机和BlueField-3 SuperNIC
  • Spectrum-XGS以太网完全基于标准,支持SONiC等开放式以太网协议栈

相关新闻

NVIDIA的网络产品组合已超越Spectrum-XGS以太网,包括用于高带宽、低延迟扩展互连的NVLink Fusion,以及针对6G的AI原生无线网络的发展。这些进步共同构成了NVIDIA全面应对下一代AI和高性能计算环境网络需求的方法。

总结

Summary illustration

NVIDIA的Spectrum-XGS以太网技术代表了AI基础设施的重大里程碑,为将分散的数据中心连接成统一的AI超级工厂提供了前所未有的能力。随着该技术被行业领导者采用和实施,它有望大幅加速AI研究和开发,使更复杂和强大的AI模型能够利用广泛、地理分散的计算资源。

タイトルとURLをコピーしました