在配备AI加速器的现代数据中心中,用于光学连接的收发器模块可能迅速发展为能耗大户,消耗数MW功率。NVIDIA希望通过其Spectrum-X和Quantum-X系列的新硅光子交换机来解决这一问题。
硅光子学:其背后的原理
简而言之,硅光子学意味着在交换机中,除了交换机ASIC(专用集成电路)外,同一基板上还集成了一颗硅光子引擎,其功能包括调制外部激光源的光信号。在NVIDIA的设计中,交换机ASIC与硅光子引擎共同构成了光子封装(Photonics Package),因此该技术也被称为“共封装光学”(Co-packaged Optics, CPO)。
硅光子学技术的优势在于,无需再依赖数十个复杂的外部光学收发器。传统方案中,电信号需经数字信号处理器(DSP)处理后,通过外部调制并借助激光转换为光信号。而收发器的主要缺点恰恰是其极高的能耗——单个模块功耗约30W,其中20W由DSP消耗,10W用于激光器。
NVIDIA的共封装硅光子学技术只需为同一连接提供9W功耗,其中7W由硅光子引擎消耗,2W用于提供连续激光输出的外部激光源(ELS)。这是因为所有信号处理步骤均通过节能的光子封装完成,而非依赖高能耗的收发器。传统方案中,电信号需从激光器传输至数字信号处理器(DSP),再经收发器的插槽支架、交换机的电路板、ASIC基板接口,最终抵达交换机ASIC——这一复杂路径被大幅简化。在共封装光学方案中,信号仅需从交换机ASIC通过基板直达硅光子引擎。NVIDIA指出,这种设计使信号损耗降至仅4dB,而传统方案则高达22dB。
核心优势
● 能耗降低:
相同连接数量下激光器数量减少四倍,能效较传统交换机提升3.5倍。
● 信号完整性提升:
通过缩短信号路径,信号损耗减少82%(从22dB降至4dB),整体性能提升63倍。
将MW级电力投资于更多
GPU
NVIDIA认为,硅光子学技术对于未来庞大的“AI工厂”级数据中心而言,几乎是实现进一步扩展规模的必要条件。NVIDIA指出,若继续使用传统收发器,随着机架数量及互联规模的增加,功耗可能迅速攀升至数MW级别。
以拥有10万台GPU的超大规模数据中心为例:若采用当前一代交换机,仅收发器部分就将消耗40MW电力;而若改用硅光子学技术,网络组件的功耗可降低至12MW。
NVIDIA CEO黄仁勋在主题演讲中半开玩笑地表示
:
“省下的这些MW电力,当然可以用来为数据中心添置更多GPU。”
关键数据对比
32MW(节省80%),可直接转化为GPU算力投资
这一技术革新不仅大幅降低能耗,更重新定义了超大规模AI基础设施的能源分配逻辑。
三款硅光子交换机
亮相GTC
NVIDIA在GTC大会上宣布推出三款基于硅光子学的交换机:
(Quantum-X系列,支持InfiniBand)
和
SN6800
(Spectrum-X系列,支持Ethernet)
性能参数
· 提供
144个800 Gbit/s端口
或
576个200 Gbit/s端口
·
整体带宽分别达到
102.4 Tbit/s
和
409.6 Tbit/s
技术亮点
通过硅光子学技术,NVIDIA进一步提升了超大规模数据中心的互联能力,兼顾高带宽、低延迟与能效优化,为AI训练和高性能计算场景提供更强支撑。
NVIDIA的Quantum-X硅光子InfiniBand产品计划于
2025年下半年
推出,而Spectrum-X硅光子以太网系列则预计在
2026年下半年
面世。此外,NVIDIA还计划将开发过程中获得的专利技术授权给第三方企业。