专栏名称: SDNLAB

SDNLAB是专注网络创新技术的先锋媒体社区和实践应用平台，涵盖AI 网络、DPU/智能网卡、SD-WAN/SASE、Web3.0、零信任、云网融合等相关领域，提供新闻资讯、技术交流、在线实验、行业分析、求职招聘、教育培训等多元服务。

万卡十万卡大模型网络拓扑都是什么样的？

SDNLAB · 公众号 · · 2025-03-14 15:00

正文

*来源：西贝吹风

在AI大模型训练场景中，智算集群内网络架构的优劣对GPU服务器内外的集合通信存在极大影响，智算集群需支持万卡及以上的并行能力，因此，设计大规模、高可靠、低成本、易运维的优质网络架构，对于满足大模型训练的大算力、低时延和高吞吐需求具有重要意义。

本文我们就重点看一下业内的万卡、十万卡的组网方案，本文不做过多的技术方面的详细阐述，重点呈现给读者各厂家的大模型组网拓扑，满满的干货，下面的组网模型，基本都是各厂家公开信息中提及的，小编进行了细化，个别地方可能与实际情况略有出入，仅供参考！

多级CLOS架构组网

之前的文章中我们提到过基于叶脊交换机胖树架构，两层架构无法满足规模扩展时，可以采用类似Facebook的三层组网架构，增加一层Super-Spine来进行扩展。

这种架构采用1:1无收敛设计，可以通过扩展网络层次提升接入的GPU节点数量，该架构的本质是多级CLOS架构网络，也是目前采用的比较多的智算网络架构。

具体到不同的客户在进行CLOS架构组网时，又会根据实际的情况，对网络结构进行调整，GPU服务器的接入也会区分为多轨接入和单轨接入，我们在后面的案例中，会看到两种接入形式的区别，其中，多轨接入是指GPU 服务器上的8张网卡依次接入8台Leaf交换机，多轨接入方式集群通信效率高，大部分流量经一级Leaf传输或者先走本地GPU服务器机内代理再经一级Leaf传输（如：不同服务器的同轨GPU直接通过直连的Leaf进行传输；不同服务器的不同轨GPU进行通信，先在服务器内转换成同轨通信，再通过直连的Leaf进行传输）；单轨接入方式是指GPU服务器上的8张网卡全部接入同一台Leaf交换机，该方式集群通信效率偏低，但在机房实施布线中有优势，若Leaf 交换机发生故障，多轨接入方式所影响的GPU服务器数量多于单轨接入方式。

在组建大规模网络时，除了要考虑网络拓扑以外，还需要综合考虑并行计算模式、功耗、可靠性与故障恢复、成本等多方面的因素，本文重点是聚焦在网络拓扑方面，下面我们来具体看一下业内主要大模型的组网架构。