本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号,以便更好地与读者互动。
昨天的
GTC
上,达索系统技术顾问严申申同学在演讲中反复提到:
他
20
年前接触的显卡还是
GLoria
、
GLoria II
这些,还充满回忆地谈起了后来的
QuadroPlex 7000
显卡盒子。
那时我在台下就想说,当年俺就是做显卡的,对曾经的型号还是那么熟悉,有文为证《
20
年变迁:
图形工作站
&
专业显卡——
ELSA GLoria-XXL
篇
》。
明天要早起,但还是想写点东西分享给大家,到比较晚了才有点状态。这又是一个倒逼自己学习
/
思考的过程,只能说我的技术水平还太有限,许多领域的研究还不够深入。
由于目前工作的原因,我这两年关注工作站、专业显卡比较多一些。本次
NVIDIA GTC
大会的重点仍然是一些热门领域,比如
AI/
深度学习、光线追踪、自动驾驶乃至于云游戏(不少人都想蹭下
5G
);而像
用户群广大的传统存量市场,比如
CAD
三维设计
,除了每一代
Quadro
更新提高速度还能有啥新鲜的?
就像我之前在《
SolidWorks2020
测试:
GPU
如何速度翻倍
&
赢画质?
》和《
SolidWorks
测试
(3)
:
五款显卡选择指南,
AMD
、
GeForce
也来凑热闹
》两篇中写的,如果说达索在之前的软件版本中未能充分发挥显卡的硬件性能,如今新版本补上来了。但这一点应该并没有用到
Quadro RTX
这代
Tensor Core
、
RT Core
的新特性。
上面这段
300
帧的视频,我在
Quadro RTX 3000
(
Dell 7540
)移动工作站上渲染时间用了
20
分
13
秒。
关于最终渲染和实时渲染的区别,概念上我就不多写了,有兴趣的朋友可以来GTC合作伙伴展区聊聊。
反倒是《
SolidWorks
渲染测试:
CPU & GPU
光线追踪性能、画质对比
》中的新版本
SolidWorks Visualize
渲染组件,在最新一代显卡上有质的提升。详细速度对比大家可以点击链接查看,我在此就不重复列出了。
这次听
NVIDIA
浩南兄的技术演讲不免有点感慨,还记得
10
年前我也是在台下听浩南兄讲工作站:)
其中前沿的技术对我多少有点冲击,比如
光线追踪的实时渲染
。要是说到游戏,或者
3DMark
中的测试场景,大家都不难理解那是提高画面效果的,同时还要达到足够的流畅度(起码
30FPS
吧)。而我的关注点是工作站上的应用,也就是在
CAD/CAE
制造业。
制造业可视化:
达索
3DEXPERIENCE
和
CEI IC.IDO
值得一提的是,
3DEXPERIENCE
就是收购的当年在工业可视化领域大名鼎鼎的
RTT
。
达索
3DEXPERIENCE
的这段分享我没有详细记录,其中操作视频效果还是不错的,也是光线追踪,但能达到实时交互操作的效果,至少
10-15FPS
吧。
加上来展台交流的
EPIC
朋友(也就是做
Unreal Engine
那家公司)所说,人家对场景优化后也能做到实时光线追踪。当时我对自己搭的
SolidWorks
演示感觉有点压力,因为用
2
块
RTX 5000
显卡渲染一帧画面还要
5
秒呢,玩过传统渲染器的朋友们来评一下,这真的是技术上的差距吗?
为了在该问题上找线索,下面重点谈谈另一家重要软件厂商
CEI
的分享,其中列举了不少对比数字。
注:
ICIDO
(或作
IC.IDO
)是法国
ESI
集团为用户提供的虚拟现实解决方案和工程虚拟样机仿真分析协同决策平台。
上面的数字看上去不小,
1.5
亿个多边形
(三角形),大概是什么样的规模呢?我在《
VR
测试:
8K
、移动工作站和极端挑战
》中曾拍过一个对比图,测试中一个复杂
VR
场景不过是
1000
万个三角形,后来在《
NVIDIA 2080Ti
两倍于
1080
性能?
8K VR&
渲染测试
(
续
)
》里面我也讲了,
GeForce RTX 2080 Ti
显卡跑下来平均帧数不过
65
。不过我们也要注意到,
Unigine Superposition
测试在同时使用了
70
个光源,以及模拟现实世界中的纹理(材质)。
那么回过头来再看上面的
3DEXPERIENCE
模型,
有纹理吗?光照计算也不是太复杂吧?
这些和应用需求特点有关,我这里写的就是想说明:不能孤立地看待某一项指标,要全面对比才有更多的参考意义。
光线追踪和
VR
,鱼与熊掌?
在
NV
的会上,显卡
/GPU
性能提升估计是一个永恒的话题。上图中我们先记一下红圈标注的部分——
Quadro P6000
跑到
94 FPS
,然后接着往下看。
这里讲
2
块
Quadro GV100
配
NVLINK
也是
90FPS
,看来不是同一个测试场景?
OpenGL Mono
指的就是传统
单屏显示
,平均
217.2 FPS
;
VR SLI Stereo
应该是
2
块显卡配
NVLINK
之后,输出到
VR
头盔的
2
个屏,此时帧率仍有
197.5
,相当于
双卡立体显示的效率
为
0.903
。
OptiX
大家可能不陌生了,我简单写过一篇《
实测:
光线追踪过去
9
年有多大改进?
》。在光线追踪下,可以看到
GV100
也只跑到
13.46 FPS
,如果开
全局光照
则降至
8.47
帧
/
秒。
前面都是背景,然后
RTX8000
光线追踪跑到
29 FPS
,比
GV100
提升
123%
。哈哈
但别忘了,此时的分辨率只是
2560 x 1440
,不是
VR
哦。根据这个速度水平,即使您加第
2
片
RTX8000
和
NVLINK
,我认为当前
同时支持高质量光线追踪
+VR
也是达不到流畅的?更不要说单眼
2K
、
4K
的
VR
。
这张
ppt
可以做对比参考。此时应该是用了光线追踪
+VR
,面片数为
3900
万(不再提
1.5
亿那个吓人数字了),对光线
只做
3
级反射,而且没有全局照明
。在这种情况下,谈谈沉浸式虚拟现实还是
ok
的。
小结
说实话以现在的硬件水平,
PC
上的
CG
游戏、以及工业可视化中的
实时光追特效,还是无法和
3D
动漫影片的画质相比
。我比较土电影看的少,大家还记得《阿凡达》的效果吗?要知道那还是当年的技术水平,一部大片动用几百台服务器
/
工作站最终渲染花
2-3
个月是很正常的。
如今的
GPU
的提升确实大,特别是光线追踪方面。但同时
内容的要求也提高了,分辨率
4K-8K
,色彩空间
BT.2020
、
12bit HDR
等等
。最终在硬件设备上花的钱也不一定少很多,计算和存储都是如此。
光线追踪只是个技术,可以有不同的用法,
并不是说只有实时的才是最好
,虽然它看上去很酷炫。工业可视化和照片级渲染的要达到的
质量要求是不同的
,另外
UE4
引擎可以用来做影视特效而许多时候也被用来做游戏场景。反过来看,
Arnold
、
VRAY
、
Blender
乃至
SolidWorks Visualize
这些渲染引擎也都不是吃素的。
这里插一个小广告:
国内做
BIM
家装行业一款领先的软件品牌打扮家,最新打造了“极光渲染引擎”,就是为
RTX
显卡光线追踪做了充分优化,来加速效果图的渲染。
据我观察,实际工作时显卡负荷应该跑的比较满,以至于显卡风扇会长期保持在高转速下。
最后给大家看看我的
Demo
设备:
Dell Precision 7920 Tower
工作站上,配了
2
块
Quadro RTX 5000
显卡。具体到
SolidWorks Visualize
应用,其实不需要插那个
NVLINK
桥接器也一样工作,这个取决于应用特点和具体程序设计相关。
RTX 5000
显卡本身的
TDP
功耗为
230W
,
SolidWorks Visualize
实际跑起来压力不算太大,每片卡大约
150W
左右吧。
注
:
本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。
进一步交流
技术
,
可以
加我的
微信
/
QQ
:
490834312
。
如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文,并包括本行及如下二维码。
感谢您的阅读和支持!《企业存储技术》微信公众号:
HL_Storage
长按二维码可直接识别关注
历史文章汇总
:
http://chuansong.me/account/huangliang_storage