上周的GTC发布会,英伟达为世界展示了blackwell的新平台,强大的算力、强大的互联能力,震撼了每一个关心世界未来发展的人。
黄仁勋的野心,不仅仅是为世界提供算力芯片,他想为世界提供大模型之下的整套接近方案,包括硬件和软件,甚至他更想成为全球人工智能工厂,他寄希望他的AI Enterprise成为永续挣钱的印钞机(每年每颗GPU4000美金的运营费),而不是一次性的硬件销售。
为了实现这个远大的目标,他的第一步就应该是从卖板卡变成卖机柜。这就是NVL72为什么被他在GTC上重点推荐的理由。
不管他卖的是板卡还是NVL72机柜,一种新的高速信号连接方式-铜互连,冲破苍穹,展示在全世界面前,为人类应对人工智能、万物互联、万物智能提供了一种全新思路。
不得不说,这还真是一种不赖的蹊径。就像黄教主说的那样,采用铜互联方式,成本降成原来的1/6,还省电了20%,当然还有盲插拔的安装便利。仅凭前两点,已经足够被优选出来,不是不赖,而是优选。
在全球最先进的AI服务器机柜上,全球最高速的大速据传输的系统中,这个示范效应足以令其他人效仿。所以铜互连,不仅仅是NVL72,不仅仅是AI,可能会在诸多领域争相被应用。当然,这个连接距离上限在英伟达这里是2米。
开放的世界总是催人奋进。PCI-e,一种被认为和英伟达NVlink形成竞争关系的芯片间高速信号传输协议,迭代升级发布了新一代PCIe5.0和PCIe6.0规范。新规范在2024年3月18日,也就是英伟达GTC发布会的前一天,率先发布了采用铜缆应用于系统内部接口的规范。事实上,不仅仅是内部接口,外部接口采用铜互联方式的规范早在2023年11月就已经公之于众了。
更有甚者,最近在美股新上市的Astera labs (ALAB.O)上市才一周,最高涨幅超过80%。刚上市就涨幅这么大,其中原因之一是:其声称可以将铜缆连接长度上限提升到7米,比黄仁勋说的2米,又长了5米。
同样是在上周,博通半导体事业部负责人称其200Gbps的serdes能支持铜缆4米以上,比英伟达的2米也多出了一倍。
总之,铜缆的适用范围还真不小,不仅仅是Blackwell。尤其是板子上的铜缆连接方式还是蛮新颖的,值得重视。
安费诺作为全球高速连接器龙头厂商也是在2024年推出了多款224G高速互联方案,包括:OverPass 线缆背板连接方案、UltraPass内部高速IO方案及散线方案。
随着行业定义224G速率,现有架构将被推向极限,创新技术将有机会取代旧架构成为新标准。随着系统厂商被迫限制每个链路中的连接点数量,盒内点对点电缆组件将更接近芯片封装,甚至就在芯片封装之上。散热挑战将与EMI一样重要。
为避免线路板上PCB trace的信号损耗,连接器采取靠近芯片或者安装在芯片封装之上的方式,即OverPass with near-chip、OverPass on chip。
因而连接器可以分为:Near chip/On chip、External IO、BackPlane三类。
内部高速IO线缆组件特质:
对照NVL72机柜里面NVswitch tray的照片,我们推测:
根据拍摄图大概可以看到外部铜缆结构如下:
从上面信号损耗表格,我们大致可以推测出:
-
NVSwitch芯片信号出来后,先经过Near chip 连接器损失了3dB(其中芯片封装损失1dB、PCB走线损失了1.5dB、连接器损失了0.5dB);
-
NVswitch tray内部线缆采用Twinax cable(双绞屏蔽线缆),采30AWG- 32 AWG(线径:0.2-0.25mm)线长大约150mm。内部线缆损耗2dB。
-
NVswitch tray内部的BackPlane连接器损失1dB;
-
外部铜缆连接NVswitch tray端连接器采用QSFP DO连接器,损失1dB
-
外部铜缆大约长1m,信号损失6dB;
-
NVGPU tray 连接器损失1dB;
-
NVGPU tray PCB 走线损失3dB;
-
NVGPU tray 芯片封装损失1dB。
-
合计损失:
3+2+1+1+6+1+3+1=18dB。
需要提醒的是:18dB中并没有考虑连接器与线缆焊接处,连接器与连接器接触处的信号损失。考虑这些因素,整条链路信号损失约为20dB。按照一般高速信号链路协议规范,信号总损失控制在35dB以内即可。由此可见铜缆这种连接方式还是有15dB裕量的。
铜缆的规格就像上面所述:镀银镀锡铜线、镀铝聚酯薄膜屏蔽,氟化聚合物绝缘(32AWG或30AWG)。
但铜缆端连接器外部壳体采用不锈钢、座底采用高性能热塑性塑料( UV94V-0)、接触部分(端子和插针):采用高性能铜合金。内部结构图如下: