专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
51好读  ›  专栏  ›  企业存储技术

NVIDIA GTC随笔:实时光线追踪 vs. 影视照片级渲染

企业存储技术  · 公众号  ·  · 2019-12-19 07:30

正文

请到「今天看啥」查看全文


本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号,以便更好地与读者互动。


昨天的 GTC 上,达索系统技术顾问严申申同学在演讲中反复提到: 20 年前接触的显卡还是 GLoria GLoria II 这些,还充满回忆地谈起了后来的 QuadroPlex 7000 显卡盒子。 那时我在台下就想说,当年俺就是做显卡的,对曾经的型号还是那么熟悉,有文为证《 20 年变迁: 图形工作站 & 专业显卡—— ELSA GLoria-XXL 》。


明天要早起,但还是想写点东西分享给大家,到比较晚了才有点状态。这又是一个倒逼自己学习 / 思考的过程,只能说我的技术水平还太有限,许多领域的研究还不够深入。

由于目前工作的原因,我这两年关注工作站、专业显卡比较多一些。本次 NVIDIA GTC 大会的重点仍然是一些热门领域,比如 AI/ 深度学习、光线追踪、自动驾驶乃至于云游戏(不少人都想蹭下 5G );而像 用户群广大的传统存量市场,比如 CAD 三维设计 ,除了每一代 Quadro 更新提高速度还能有啥新鲜的?

就像我之前在《 SolidWorks2020 测试: GPU 如何速度翻倍 & 赢画质? 》和《 SolidWorks 测试 (3) 五款显卡选择指南, AMD GeForce 也来凑热闹 》两篇中写的,如果说达索在之前的软件版本中未能充分发挥显卡的硬件性能,如今新版本补上来了。但这一点应该并没有用到 Quadro RTX 这代 Tensor Core RT Core 的新特性。

上面这段 300 帧的视频,我在 Quadro RTX 3000 Dell 7540 )移动工作站上渲染时间用了 20 13 秒。 关于最终渲染和实时渲染的区别,概念上我就不多写了,有兴趣的朋友可以来GTC合作伙伴展区聊聊。

反倒是《 SolidWorks 渲染测试: CPU & GPU 光线追踪性能、画质对比 》中的新版本 SolidWorks Visualize 渲染组件,在最新一代显卡上有质的提升。详细速度对比大家可以点击链接查看,我在此就不重复列出了。


这次听 NVIDIA 浩南兄的技术演讲不免有点感慨,还记得 10 年前我也是在台下听浩南兄讲工作站:)

其中前沿的技术对我多少有点冲击,比如 光线追踪的实时渲染 。要是说到游戏,或者 3DMark 中的测试场景,大家都不难理解那是提高画面效果的,同时还要达到足够的流畅度(起码 30FPS 吧)。而我的关注点是工作站上的应用,也就是在 CAD/CAE 制造业。

制造业可视化: 达索 3DEXPERIENCE CEI IC.IDO

值得一提的是, 3DEXPERIENCE 就是收购的当年在工业可视化领域大名鼎鼎的 RTT

达索 3DEXPERIENCE 的这段分享我没有详细记录,其中操作视频效果还是不错的,也是光线追踪,但能达到实时交互操作的效果,至少 10-15FPS 吧。

加上来展台交流的 EPIC 朋友(也就是做 Unreal Engine 那家公司)所说,人家对场景优化后也能做到实时光线追踪。当时我对自己搭的 SolidWorks 演示感觉有点压力,因为用 2 RTX 5000 显卡渲染一帧画面还要 5 秒呢,玩过传统渲染器的朋友们来评一下,这真的是技术上的差距吗?

为了在该问题上找线索,下面重点谈谈另一家重要软件厂商 CEI 的分享,其中列举了不少对比数字。

注: ICIDO (或作 IC.IDO )是法国 ESI 集团为用户提供的虚拟现实解决方案和工程虚拟样机仿真分析协同决策平台。


上面的数字看上去不小, 1.5 亿个多边形 (三角形),大概是什么样的规模呢?我在《 VR 测试: 8K 、移动工作站和极端挑战 》中曾拍过一个对比图,测试中一个复杂 VR 场景不过是 1000 万个三角形,后来在《 NVIDIA 2080Ti 两倍于 1080 性能? 8K VR& 渲染测试 ( ) 》里面我也讲了, GeForce RTX 2080 Ti 显卡跑下来平均帧数不过 65 。不过我们也要注意到, Unigine Superposition 测试在同时使用了 70 个光源,以及模拟现实世界中的纹理(材质)。


那么回过头来再看上面的 3DEXPERIENCE 模型, 有纹理吗?光照计算也不是太复杂吧? 这些和应用需求特点有关,我这里写的就是想说明:不能孤立地看待某一项指标,要全面对比才有更多的参考意义。

光线追踪和 VR ,鱼与熊掌?


NV 的会上,显卡 /GPU 性能提升估计是一个永恒的话题。上图中我们先记一下红圈标注的部分—— Quadro P6000 跑到 94 FPS ,然后接着往下看。

这里讲 2 Quadro GV100 NVLINK 也是 90FPS ,看来不是同一个测试场景?

OpenGL Mono 指的就是传统 单屏显示 ,平均 217.2 FPS VR SLI Stereo 应该是 2 块显卡配 NVLINK 之后,输出到 VR 头盔的 2 个屏,此时帧率仍有 197.5 ,相当于 双卡立体显示的效率 0.903

OptiX 大家可能不陌生了,我简单写过一篇《 实测: 光线追踪过去 9 年有多大改进? 》。在光线追踪下,可以看到 GV100 也只跑到 13.46 FPS ,如果开 全局光照 则降至 8.47 / 秒。


前面都是背景,然后 RTX8000 光线追踪跑到 29 FPS ,比 GV100 提升 123% 。哈哈

但别忘了,此时的分辨率只是 2560 x 1440 ,不是 VR 哦。根据这个速度水平,即使您加第 2 RTX8000 NVLINK ,我认为当前 同时支持高质量光线追踪 +VR 也是达不到流畅的?更不要说单眼 2K 4K VR


这张 ppt 可以做对比参考。此时应该是用了光线追踪 +VR ,面片数为 3900 万(不再提 1.5 亿那个吓人数字了),对光线 只做 3 级反射,而且没有全局照明 。在这种情况下,谈谈沉浸式虚拟现实还是 ok 的。

小结

说实话以现在的硬件水平, PC 上的 CG 游戏、以及工业可视化中的 实时光追特效,还是无法和 3D 动漫影片的画质相比 。我比较土电影看的少,大家还记得《阿凡达》的效果吗?要知道那还是当年的技术水平,一部大片动用几百台服务器 / 工作站最终渲染花 2-3 个月是很正常的。

如今的 GPU 的提升确实大,特别是光线追踪方面。但同时 内容的要求也提高了,分辨率 4K-8K ,色彩空间 BT.2020 12bit HDR 等等 。最终在硬件设备上花的钱也不一定少很多,计算和存储都是如此。

光线追踪只是个技术,可以有不同的用法, 并不是说只有实时的才是最好 ,虽然它看上去很酷炫。工业可视化和照片级渲染的要达到的 质量要求是不同的 ,另外 UE4 引擎可以用来做影视特效而许多时候也被用来做游戏场景。反过来看, Arnold VRAY Blender 乃至 SolidWorks Visualize 这些渲染引擎也都不是吃素的。

这里插一个小广告: 国内做 BIM 家装行业一款领先的软件品牌打扮家,最新打造了“极光渲染引擎”,就是为 RTX 显卡光线追踪做了充分优化,来加速效果图的渲染。 据我观察,实际工作时显卡负荷应该跑的比较满,以至于显卡风扇会长期保持在高转速下。


最后给大家看看我的 Demo 设备: Dell Precision 7920 Tower 工作站上,配了 2 Quadro RTX 5000 显卡。具体到 SolidWorks Visualize 应用,其实不需要插那个 NVLINK 桥接器也一样工作,这个取决于应用特点和具体程序设计相关。


RTX 5000 显卡本身的 TDP 功耗为 230W SolidWorks Visualize 实际跑起来压力不算太大,每片卡大约 150W 左右吧。



本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流 技术 可以 加我的 微信 / QQ 490834312 如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。 感谢您的阅读和支持!《企业存储技术》微信公众号: HL_Storage

长按二维码可直接识别关注


历史文章汇总 http://chuansong.me/account/huangliang_storage

点击下方“阅读原文”,查看更多历史文章
↓↓↓






请到「今天看啥」查看全文


推荐文章
滴滴代驾服务订阅平台  ·  214积分,请收下我的情人节礼物,文末有彩蛋
8 年前
禅茶一味  ·  紫砂壶这么贵!究竟是为什么?
8 年前
浙江市场监管矩阵  ·  小超市“不小心”卖了假的卫生巾之后……
7 年前
经典人生感悟  ·  人,不孝不可交,人,不诚不可处!
7 年前