当前位置: 飞沙系统网 >  系统资讯 >  NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输

NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输

更新时间:2025-06-09 18:44:33作者:fs0745
NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输

从大语言模型(LLM)到代理式 AI 推理和物理 AI ,随着 AI 工作负载的复杂性和规模不断增加,人们对更快、扩展性更高的计算基础设施的需求空前强烈。满足这些需求就要从基础开始重新思考系统架构。


NVIDIA 正在通过 NVIDIA ConnectX-8 SuperNIC 升级平台架构。NVIDIA ConnectX-8 SuperNIC 是业内首款在单个设备中集成 PCIe6.0 交换机和超高速网络的 SuperNIC。ConnectX-8 专为现代 AI 基础架构设计,可提供更高的吞吐量,同时简化系统设计,并提高能效和成本效益。


为 PCIe6.0 连接的时代做好准备


在基于 PCIe 连接的平台中,尤其是配备 8 个或更多 GPU 的平台,PCIe 交换机对于最大化 GPU 间通信带宽和实现可扩展的 GPU 拓扑至关重要。现有设计依赖于独立的 PCIe 交换机,这通常会增加设计复杂性,并可能会限制性能和效率。


ConnectX-8 通过内置的 PCIe6.0 交换机提供 48 通道的 PCIe6.0 连接解决了这一问题。将 GPU 到 GPU 和 GPU 到 NIC 通信整合到单一高性能设备中,消除了对独立 PCIe 交换机的需求,减少了元器件数量并简化了主板设计,为 AI 基础设施打造了更具成本效益、可扩展的架构。


此外,凭借原生 PCIe6.0 支持,ConnectX-8 可满足新一代 GPU、CPU 和 IO 加速器日益增长的 IO 需求。它使系统架构师能够设计出向前兼容的平台,能够充分享用领先的高吞吐 PCIe6.0 设备的带宽。


通过 NVIDIA RTX PRO 服务器加速企业工作负载


ConnectX-8 SuperNIC 现已全面投产。 在 COMPUTEX 2025 上,ConnectX-8 被发布用于全球各系统合作伙伴的 NVIDIA RTX PRO 服务器中。


图 1 比较了两种服务器架构:采用独立 PCIe 交换机的传统设计,以及采用 NVIDIA ConnectX-8 SuperNIC 集成 PCIe6.0 交换机的 NVIDIA RTX PRO 服务器的 优化配置。


NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输

图 1:传统(左)和与采用 ConnectX-8 SuperNIC 优化(右)服务器设计的比较



在传统设计中,服务器布局包括 2 个 CPU、8 个 GPU 和 5 个 NIC(包括 4 个 NVIDIA ConnectX-7 NIC 和 1 个 NVIDIA BlueField-3 DPU)。这种配置还需要两到四个独立的 PCIe 交换机来实现 GPU 到 GPU 和 GPU 到 NIC 的连接,从而增加复杂性和组件数量。


在优化过的设计中,用 ConnectX-8 SuperNIC 替换掉了专用 PCIe 交换机,将 PCIe6.0 交换和 800 Gb/s 网络集成在了单一网卡设备中。


它使每个 GPU 的网络带宽翻倍,有助于消除 IO 瓶颈,并加快 GPU、NIC 和存储之间的数据移动速度。因此,此 NVIDIA RTX PRO 服务器平台可提供高达 2 倍的 NCCL all-to-all 性能,加速在多 GPU 和多节点工作负载中至关重要的集合通信,并提高 AI 工厂的可扩展性。


在图 1 的基础上,图 2 让我们更深入地了解经过优化设计的服务器架构如何改善三种主要 GPU 通信路径之间的连接:


GPU 到 GPU 通信跨越两个 CPU 插座:在传统设计中,此路径可能会遇到主机 CPU 和内部插座瓶颈问题,根据 CPU 之间链路的利用率不同,可能被限制在 25 GB/s 或更低的速度。相比之下,基于 ConnectX-8 的优化设计可为集群内的所有 GPU 间通信提供高达 每个GPU 50 GB/s 的 IO 带宽,因为 NCCL 直接通过网络转发所有流量。


GPU 到 NIC 通信:在 2:1 的 GPU 到 NIC 配置下,经过优化的架构为每个 GPU 提供 50 GB/s 的带宽,无论 GPU 或主机系统是 PCIe5.0 或 PCIe6.0。


GPU 到 GPU 通信通过同一 PCIe 交换机:相较 PCIe5.0,配备 PCIe6.0 的系统可将带宽提高一倍,从而显著加速同一 PCIe 交换机上的点对点 GPU 传输。


NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输

图 2:传统(左)和与采用 ConnectX-8 SuperNIC 的优化(右)服务器设计的比较,强调了三种关键的 GPU 通信路径



通过将 PCIe 交换直接集成到 SuperNIC 中,ConnectX-8 还简化了主板设计、改善了气流并增强了可维护性。这将打造一个更紧凑、更节能、更经济高效的平台。在 NVIDIA 参考设计的支持下,这项创新可帮助系统厂商更快地扩展其系统,并提高性能及降低 TCO。


基于 PCIe 总线的 AI 基础架构的未来


NVIDIA ConnectX-8 正在重新定义基于 PCIe 总线的系统的可能性。通过将 PCIe6.0 交换机和高性能 SuperNIC 集成到单一集成设备中,ConnectX-8 可简化服务器设计,减少组件数量,并解锁现代 AI 工作负载所需的高带宽通信路径。从而打造更简单、更节能的平台,同时降低总体拥有成本(TCO)并实现出色的性能可扩展性。


此外,ConnectX-8 SuperNIC 还可在基于多 GPU 的平台中实现增强的机密计算能力。


在 COMPUTEX 2025 上,领先的数据中心合作伙伴展示了由内置 NVIDIA ConnectX-8 SuperNIC 的 NVIDIA RTX PRO 服务器所加速的先进 AI 平台架构。


如需详细了解 ConnectX-8 SuperNIC 在 NVIDIA Spectrum-X 平台中的作用及其如何加速现代 AI 基础设施,请参阅以下文章:NVIDIA SuperNIC 驱动新一代 AI 网络发展 - NVIDIA 技术博客

NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构,实现高效数据传输相关教程

热门推荐

Copyright ©  2009-2025 飞沙系统网 www.fs0745.com 版权声明 网站地图