漫画揭秘一个超快的渲染引擎（下）

奇舞周刊 · 公众号 · 前端 · 2017-10-17 12:08

正文

编者按：本文由文蔺在众成翻译平台上翻译。书接上文，昨天我们介绍了webRender出现的背景，今天用漫画来解释一下它是如何学习游戏引擎让网页渲染如丝般顺滑～

像游戏引擎一样使用 GPU

如果停止尝试猜测需要什么图层呢？如果不考虑区分绘制与合成，仅考虑每一帧绘制像素呢？

这听起来似乎很荒谬，但实际有先例可循。现代视频游戏重新绘制每个像素，并且比浏览器更可靠地保持每秒 60 帧。他们以一种意想不到的方式做到了这一点...他们只是重绘整个屏幕，无需创建那些用于最小化绘制内容的失效处理矩形和图层。

这样渲染网页不会更慢吗？

如果在 CPU 上绘制的话，的确会更慢。但 GPU 就是用来做这事的。

GPU 正是用于极端并行处理的。我在上一篇关于 Stylo 的文章中谈到过并行的问题。通过并行，机器可以同时执行多种操作。它可以一次完成的任务数量，取决于内核数量。

CPU 通常有 2 到 8 个内核。GPU 往往至少有几百个内核，通常有超过 1,000 个内核。

虽然这些内核的工作方式有所不同。它们不能像 CPU 内核那样完全独立地运行。相反，它们通常一起工作，在数据的不同部分执行相同指令。

填充像素时，我们正需要这样。每个像素可以由不同的内核填充。一次能够操作数百个像素，GPU 在像素处理方面上比 CPU 要快很多...当所有内核都在工作时确实如此。

由于内核需要同时处理相同的事情，因此 GPU 具有非常严格的步骤，它们的 API 非常受限。我们来看看这是如何工作的。

首先，你需要告诉 GPU 需要绘制什么。这意味着给它传递形状，并告知如何填充。

要达到目的，首先将绘图分解成简单形状（通常是三角形）。这些形状处于 3D 空间中，所以一些形状可以在其他形状背后。然后将三角形所有角顶点的 x、y、z 坐标组成一个数组。

然后发出一个绘图调用 —— 告诉GPU来绘制这些形状。

接下来由 GPU 接管。所有的内核将同时处理同一件事情。它们会：

找到形状的所有角顶点位置。这被称为顶点着色（vertex shading）。

找出连接这些角顶点的线条。由此可以得到哪些像素被形状所覆盖。这就是所谓的光栅化（rasterization）。

已经知道形状所覆盖的像素了，就可以遍历每个像素，确定该像素的颜色。这称为像素着色（pixel shading）。

最后一步可以通过不同的方式完成。要告诉 GPU 如何处理，可以传给 GPU 一个称为像素着色器的程序。像素着色是 GPU 中可编程的几个部分之一。

一些像素着色器很简单。例如形状是单一颜色的，则着色器程序只需要为形状中的每个像素返回同一个颜色。

另外一些情况更复杂，例如有背景图像的时候，需要搞清楚图像对应于每个像素的部分。可以像艺术家缩放图像一样…在图像上放置一个网格，与每个像素相对应。这样一来，只需知道某个像素所对应的区域，然后对该区域进行颜色取样即可。这被称为纹理映射（texture mapping），因为它将图像（称为纹理）映射到像素。