“ 不装了,我们有 RTX 5090D ,我摊牌了! ”
之前跟大家盘完英伟达 RTX 50 系发布会后,托尼就非常好奇这回新显卡到底提升了多少,老黄讲的那几页 PPT 完全压制不住我的好奇心。
于是,我们在第一时间搞来了一张 RTX 5090D ,并且为了得出具体的性能提升数据,又搞来了一张 RTX 4090D 。
哎,这两张显卡一顿库库测下来,可费了老鼻子劲了。
这里就不给大家卖关子了,先说结论:坏消息是,在前代 4090 牙膏挤爆之后,这代 5090 又开始一点点地往外挤牙膏。好消息是,老黄在硬件规格这块给你挤牙膏,但反手又给你掏出了软件上的 “ 王炸 ” —— DLSS 4 。
总之一句话,以后你在英伟达这里买不到纯粹的光栅化性能提升了,之前 PPT 上讲的 5090 游戏翻倍提升,其实是有条件的翻倍提升。
话不多说,咱们开始进入正题。
关于 50 系显卡的参数规格,大家可以参考外媒整理的表格,这里我就不再展开了,省流就是:全系的纸面参数看起来都有提升。
数据来自:VideoCardz ▼
而从外观来看,这张七彩虹 RTX 5090D 采用了经典的 Advanced 系列设计,但是跟前代 4090D 比起来,整整大了一圈——这标准的 4 槽卡厚度,也太有视觉冲击力了吧!
这么大的显卡,那它一定很强吧!?
让我们先来看看它的 3D Mark 跑分,在 Time Spy 测试下, 5090D 是 46597 分,比跑出了 34551 分的 4090D 强了差不多 35% 。
而在渲染压力更高的 Time Spy EXtreme 测试下, 5090D 是 25765 分,对比 4090D 提升了约 42% 。
这个提升是啥概念呢?
根据极客湾之前的测试结果, Time Spy 下, 4090 要比 3090 强了 85% ,比 3090Ti 强了 71% ;Time Spy EXtreme 下, 4090 要比 3090 提升了 92% ,比 3090Ti 提升了 74% 。
这么看来,在这种纯光栅化的跑分中,这代 5090D 的提升确实没有咱们预期的那么大。
数据来源:极客湾 ▼
跑分就这样了,那实际的游戏表现又如何呢?
咱们先上点开胃菜,先看看 GPU 负载压力相对没那么高的电竞游戏。
APEX 在 4K 画质拉满的情况下, 5090D 平均帧可以跑到夸张的 284 帧,并且 1% Low 帧也有 193 帧。
作为对比,前代 4090D 的平均帧是 264.8 帧, 1% Low 帧则是 174.2 帧。
一顿嘎嘎算之后,你会发现 5090D 相比前代帧数只提升了 7% 。
为啥提升幅度不大呢?主要也是因为 4K 高画质的 FPS 网游,已经没法给足 5090D 压力了,现在的帧率提升瓶颈反而在 CPU 或者其他配置方面。
既然如此,咱们再来上上强度,看看在《 黑神话:悟空 》这款国产 3A 游戏中,这两块卡又有怎样的表现。
需要说明的一点是,我们测试的时候黑猴还没有适配最新的 DLSS 4 ,所以正好测试下 5090D 针对 DLSS 3.5 环境的提升,而测出来的 4 组数据也挺让人意外的——压根没有之前 PPT 里说的翻倍提升,并且在画质拉满、开光追的情况下, 5090D 也跑不满 60 帧。
在负载相对较低的档位下( 4K 影视级画质、 DLSS 超采样清晰度 60 、帧生成开启 ),不开光追, 5090D 的平均帧是 148 帧,比 4090D ( 109 帧 )高了 36% 。开了光追后, 5090D 只有 115 的平均帧,但仍比 4090D ( 82 帧 )高了 40% 。
而在负载更高的档位下( 4K 影视级画质、 DLSS 超采样清晰度 100 ,帧生成开启 ),不开光追, 5090D 的平均帧为 104 帧,比 4090D 提升了 39% 。开了光追后, 5090D 为 58 帧,比前代( 40 帧 )提升了 45% 。
假如游戏没有 DLSS 4 ,只有 DLSS 3.5 的话, 5090D 的提升大概就是 35% 到 45% 这个区间。
不过,对于已经适配了 DLSS 4 的游戏来说, 5090D 的提升强得有点可怕。
这里我们拿《赛博朋克 2077 》来举例,在 4K 超级画质下,开启光追、关闭 DLSS , 5090D 的平均帧只有 35.45 。
不得不说, 2077 确实是一款面向未来的游戏,在这个画质下开光追, 5090D 不开 DLSS 都吃不住。
而当你打开这回的 DLSS 4 多帧生成后,你就会发现老黄的魔法来了,5090D 的帧数直接暴涨到 249.82 帧,对比原来的帧数差不多是 7 倍的提升啊!
我去,这你受得了嘛。
作为对比, 4090D 在开光追、关 DLSS 的设置下,就只有 22.91 帧,即便是打开了DLSS 3 单帧生成,也就只有 90.93 帧。
在 DLSS 4 多帧生成的加持下, 5090D 的帧数直接就是前代的二点多倍。
当然,这里我看网上有不少人在担心 DLSS 4 的延迟和拖影问题,关于这事儿,我们后面聊 DLSS 4 再展开。
另外,这回英伟达考虑到有些游戏还来不及适配 DLSS 4 ,所以他们直接在 NVIDIA APP 里加了一个 DLSS Override 功能——这个功能可以直接替换一部分游戏里内置的 DLSS 模块。
也就是说,即使有些游戏的开发者还没来得及更新游戏内置的 DLSS 集成,也能被这个 APP 的功能给强行替换成最新版本的 DLSS 4 ,从而达到 “ 强上 DLSS 4” 的目的。
那么效果如何呢?我也替大家伙测了一下《 漫威争锋 》这款游戏。
在同样的画质下, 5090D 开启 Override 4x 帧生成功能后,平均帧是 424 帧,要比不开这个功能的帧数( 214 帧 )高出 98% 。同时, 1% Low 帧也高出个 36% ( 从 89 帧提升到 121 帧 )。
啧啧啧,这个功能还真不是啥花架子,你还真能用它来获得帧数提升。
看到这,相信你们应该对 DLSS 4 的离谱程度有所了解了。那么问题来了:这玩意儿到底是怎么一回事呢?
直接说答案:DLSS 4 除了有全新的多帧生成技术外,还有一个重磅升级,就是引入了全新的模型架构。
以后大家的认知要被颠覆了,因为你们以后看到的游戏画面,可能不都是传统意义上的渲染画面,有可能大部分画面是 AI 给你生成出来的!
先说多帧生成技术,看过往期文章的小伙伴应该都知道,这回 DLSS 4 对比之前两帧之间插一帧的 DLSS 3 , DLSS 4 这回可以在两帧之间生成 3 帧。
所以前面的实测结果中才会出现, 5090D 超高帧率强吃 4K 光追游戏的情况。
什么 “ 拼好帧 ” 啊咱就是说 ~
但咱们调侃归调侃,老黄的这个多帧生成,还真不是友商们能随便搞出来的东西,因为这个东西涉及到两个技术难点:
一个是,帧数超级加倍,性能开销也超级加倍。另一个是,帧数翻倍,插帧延迟也会翻倍,进一步加重画面拖影和滞后等问题。
而老黄的办法就是 AI !
之前 DLSS 3 的单帧生成,需要用硬件( 光流加速器 )结合 AI 去给你算插帧,相当于出了两份力才换来了一帧的提升,性能很容易就会遇到瓶颈。
现在 DLSS 的多帧生成,直接用新的 AI 帧生成模型,把软硬件的活儿一块给干了,并且还干得更加高效,一次就能生成 3 帧。
什么 “ 赛博降本增效 ” 啊。。。
不过,虽然多帧生成的效率提高了,但老黄这边也还要解决一个问题:开启 DLSS 4 后, GPU 需要实时快速地运行多个 AI 模型,不然画面生成速度会变慢,产生咱们前面说到的延迟和拖影等问题。
对于这点,老黄整的活也挺有意思的。
一方面,英伟达这次在 RTX 50 系上掏出来的 Blackwell 架构和第五代 Tensor Core ,硬件特性就适合用来跑 AI ,这回的 AI 理论性能最高提升 2.5 倍。
另一方面,他们这回又从降低帧延迟技术入手,去提升画面的响应速度。
之前 DLSS 3 用 Reflex 技术减少了 CPU 和 GPU 的沟通成本,让 CPU 可以及时把最新的帧数据给到 GPU 进行渲染,这样 GPU 就可以一直保持高效运转状态。
但是到了 DLSS 4 多帧生成时代,这个方法就行不太通了,因为帧数翻倍后, CPU 处理不过来画面的帧节奏。
是这样的,以往不管是你看到的游戏还是视频画面,都要 CPU 来稳定帧与帧之间的节奏,画面才连贯。但多帧生成来了之后, CPU 这边的压力更大了,要算的帧数翻倍提升,容易出现算不准帧节奏,导致画面延迟变高、变卡的情况。
既然如此,老黄这回就直接把控制帧节奏的任务,交给了显卡上一个叫 Flip Metering 的模块来跑。
这样一来, CPU 和 GPU 之间的沟通成本没了, GPU 也能更精准地知道帧显示时间,让多帧生成的画面更加流畅顺滑。
总之,这代 50 系显卡,我感觉是颠覆大家认知的一代,但很有可能会是未来 NVIDIA 很长一段时间的指导路线。
硬件上小迭代,然后结合硬件的架构改动,给你掏出一个领先行业的软件技术。
无论是现在还是以后,大家买新的英伟达显卡,都不仅仅是为显卡本体的性能买单,更是为他们的 DLSS 以及 AI 等一些系列软件生态买单。
你要说这是好事还是坏事呢,我觉得很难说,毕竟老黄的这个软件开发成本也是实打实的——比如他们专门用来训练 DLSS 的大型超级计算机,每天 24 小时工作,全年无休,已经这样干了 6 年,那其他的人力成本和研发成本就更不用说了。
并且在未来,制程工艺的进步很有可能会进入瓶颈期,纯硬件升级的收益将要面临一个边际效益递减的问题,在这种情况下,英伟达搞 AI 和软件生态不失为一个可取的方案。
当然了,咱们在这逼逼叨这么多,在老黄看来,可能都不是事儿,毕竟他才是现在掌握市场主导权、掌握各行各业命脉的男人呀。。。
撰文:粿条
编辑:米罗&面线
美编:焕妍
图片、资料来源:
NVIDIA、VideoCardz
极客湾:RTX4090性能分析:这显卡太强了!