1月7日,英伟达在2025年CES 并发布了RTX 50系列GPU。英伟达首先发布了RTX 5070 GPU,售价仅549美元。据英伟达称,该GPU将通过多种方式利用AI技术,提供RTX 4090级别的性能,但价格仅为后者的三分之一。此外,移动版RTX 5070的功耗仅为RTX 4090的一半,从而在笔记本电脑上实现更高的性能水平。此次发布的50系列产品线还包括作为这一代旗舰产品的RTX 5090,售价高达1999美元,提供3400 AI TOPS的性能。RTX 5080则以更具吸引力的999美元价格,提供1800 TOPS的AI性能,略高于RTX 5090性能的一半,并继承了即将退市的RTX 4080 Super的价格。接下来是RTX 5070 Ti,售价749美元,提供1400 TOPS;最后是RTX 5070,以已提及的549美元价格,提供1000 TOPS。
根据公布的AI TOPS性能,首先显而易见的是,英伟达相对于Ada Lovelace架构,在INT8工作负载上至少将AI计算运算量翻了一番。
这些并非随意猜测。即使确切的核心数量和时钟速度可能略有偏差,但所述的计算水平应该是可行的。英伟达表示,RTX Blackwell通过着色器提供125 TFLOPS的FP32图形计算能力,是Ada代产品的1.5倍,而AI性能将是其3倍。因此,相对于着色器性能的AI性能已经翻倍。
我们尚不清楚Blackwell中使用的第五代张量核心是否能将其他数字格式的吞吐量翻倍。考虑到这些GPU的多用途应用场景——它们将用于游戏显卡,当然,也包括专业GPU和数据中心AI解决方案——我们推测张量核心的所有方面都得到了升级。
有趣的是,如果我们插入时钟速度和传闻中的核心数量,就可以更好地了解最终规格。125 TFLOPS的数据还伴随着最高4000 INT8 TOPS的性能,而RTX 5090则将其缩减至3400 TOPS。因此,125 TFLOPS的数据代表了一个假设的完全启用的Blackwell芯片,而RTX 5090将仅部分启用。这是合理的。
目前的传闻称,GB202最多拥有192个SM(流式多处理器),而RTX 5090将仅启用170个。据此计算,RTX 5090将提供约107 TFLOPS的着色器计算能力,以及3400 TOPS。但1.8 TB/s的带宽数据与先前传闻的28 Gbps GDDR7内存运行在512位内存接口上完全吻合。
英伟达在其所有游戏GPU上将AI计算能力翻倍后,会做些什么呢?自然,它计划推出新的功能和软件解决方案来充分利用这些能力。RTX 5070提供1000 TOPS的计算能力,性能几乎与RTX 4090相当,但价格仅为后者的三分之一,这为计算要求更高的任务打开了大门。
最有可能的应用场景之一是基于AI的纹理压缩。我们之前听说过这项技术,其概念已在上一代硬件上演示过……但帧率并不极高。2023年5月的神经纹理压缩(Neural Texture Compression, NTC)的运行速度不到标准BTC(块截断编码)压缩速度的一半。但18个月后,随着AI计算能力的提升和更多训练,我们完全有可能实现NTC与传统BTC相同的运行速度。
鉴于我们和其他人对现代游戏中GPU显存不足的担忧,NTC成为Blackwell一代硬件的主要新功能之一也就不足为奇了。如果得到应用,NTC能在显存使用量减少三分之一的情况下提供更高的图像质量,甚至可能让8GB显存的显卡更加可行。只是存在一个小问题:许多游戏是跨平台作品,运行在由AMD GPU驱动的游戏主机上。
如果英伟达的新纹理压缩技术需要至少一张RTX显卡,那么会有多少游戏支持这项技术呢?而如果该技术需要RTX 50系列显卡,那么支持的游戏数量将会更少。但英伟达有足够的影响力以AMD和英特尔无法做到的方式推动游戏市场的发展。
这会是传闻中的DLSS 4,即神经渲染图形吗?还是会有其他什么新技术?英伟达尚未公布,但显然NTC至少会在某种程度上归属于DLSS系列。
(图片来源:英伟达)
除了桌面GPU,英伟达还公布了移动产品线的名称。将有对应的RTX 5090、5080、5070 Ti和5070笔记本电脑,预计于2025年3月上市。虽然型号名称与桌面系列相匹配,但性能将显著降低,我们预计其他规格也会有所缩减。
RTX 5090笔记本GPU将提供1850 AI TOPS,起价2899美元。这意味着其性能基本与桌面版RTX 5080相当。移动版5080降至1350 AI TOPS,略低于桌面版5070 Ti。移动版5070 Ti将与桌面版5070一样提供1000 TOPS,而普通版5070笔记本GPU将提供高达800 AI TOPS——这可能是即将推出的桌面版RTX 5060 Ti的预告。
欢迎关注我们,并“设为星标” 可第一时间收到我们的推送消息================================
SoC 设计优化相关资料推荐