GTC24 面向无限可扩展的高性能 AI 网络会议专场回放现已开启!
作为备受关注的中文演讲专场,本场会议邀请到四位网络技术专家解读人工智能网络 -
InfiniBand 网络
和
Spectrum-X 网络
的核心技术和重要作用,探讨如何重构以数据中心为计算单元的全新 AI 计算平台。
会议直播期间,观众积极参与提问互动,并获得线上主持人的专业解答。
错过了 3 月 19 日专场直播的观众可以根据文末指引观看会议回放!
演讲嘉宾:
宋庆春
|
NVIDIA 网络亚太区高级总监
话题亮点:
如今,以 AI 工厂和生成式 AI 云为代表的新型数据中心成为了算力的主要来源,网络成为了决定数据中心性能的关键。本次会议中,演讲嘉宾带大家一起探讨了如何在这个大计算的时代构建和验证高性能的算力中心。
演讲嘉宾:
冯高锋
|
NVIDIA 网络技术市场高级总监
话题亮点:
大模型训练依赖于大规模 GPU 集群的强大算力,而算力的增长与高速网络的 IO 能力息息相关。NVIDIA 端到端的 InfiniBand 网络通过原生 RDMA 能力和强大的网络计算能力,大幅度加速 GPU 集群的 IO 能力,为大模型应用在万卡规模的超大规模集群上训练提供了强有力的性能保障。
Spectrum-X 构建以太网为底座拥有极致性能的 AI 集群
演讲嘉宾:
陈龙
|
NVIDIA 网络市场开发总监
话题亮点:
在 AI 时代背景下,传统以太网的弊端不能有效应对大规模性 AI 集群超高速互连的需求。NVIDIA
Spectrum-X 以全新的端到端解决方案,使用400Gbps 的 SuperNIC 和 NVIDIA Spectrum-4
51.2Tbps 以太网交换机,通过创新的动态路由技术和可编程拥塞控制技术,打造高性能网络互连方案,相比传统以太网方案提升了 60% 的性能。
演讲嘉宾:
王晓慧
|
UCloud 计算产品中心研发总监
话题亮点:
随着云计算和云服务在各行各业的广泛应用,企业都追求云规模效率以提升性能和可扩展性。在此背景下,硬件加速器 DPU 应运而生。DPU 具备强大的加速能力,实现软件定义的网络、存储和安全,不仅能满足最严格的性能要求,还能应对最苛刻的工作负载。UCloud 已有成功案例证明 DPU 在云主机和裸金属产品中的应用效果显著。未来,DPU 将为云端 AI 大模型的应用提供有力支撑。