专栏名称: 阿里开发者

阿里巴巴官方技术号，关于阿里的技术创新均将呈现于此

Web 性能优化｜了解 HTTP 协议后才能理解的预加载

阿里开发者 · 公众号 · 科技公司 · 2024-10-09 08:30

主要观点总结

本文探讨了多种预加载技术及其在提升网站性能和优化用户体验方面的应用。文章涵盖了服务器响应时间优化、服务端渲染与客户端渲染优化、静态资源体积减少等方面，并特别强调了网络开销问题。为解决新用户访问网站时的网络开销，文章介绍了多种预加载方法，包括prefetch、preload等，并结合流式渲染、HTTP Early Hints、HTTP/2 push等技术进行灵活运用。此外，文章还涉及CDN动态加速、dns-prefetch、preconnect、preload与prefetch预加载、prerender预渲染等技术，以及根据用户行为进行智能prefetch的方案。最后，文章介绍了Speculation Rules API、页面与首屏请求并行加载、流式渲染等内容。

关键观点总结

关键观点1: 预加载技术在网站性能优化中的应用

预加载技术可以解决新用户访问网站时的网络开销问题，通过提前加载资源减少等待时间，提供流畅的用户体验。文章介绍了多种预加载方法，包括使用HTML标签进行声明式资源引入，以及根据用户行为进行智能prefetch的方案。

关键观点2: CDN动态加速和其他优化技术的运用

CDN动态加速可以显著缩短用户到服务器的物理距离，减少传输延迟。同时，文章还介绍了dns-prefetch、preconnect等其他优化技术，以及它们在提高网站性能和用户体验方面的作用。

关键观点3: Speculation Rules API和页面并行加载

Speculation Rules API提供了一种声明式的方法来指示浏览器对哪些资源进行预取操作，开发者可以更精确地指示浏览器在何时和如何预取资源。页面并行加载则通过在用户点击页面的瞬间同时发起异步请求，提高页面加载速度。

关键观点4: 流式渲染简介

流式渲染是一种逐步将已准备好的页面内容发送到客户端的技术，使客户端可以更快接收数据并渲染页面。文章介绍了流式渲染的原理，包括使用HTTP 1.1规范中的Transfer-Encoding头字段，以及浏览器对部分HTML内容的解析和执行。

正文

阿里妹导读

本文旨在探讨和分享多种预加载技术及其在提升网站性能、优化用户体验方面的应用。

在性能优化过程中，开发者通常会集中精力在以下几个方面：服务器响应时间（RT）优化、服务端渲染（SSR）与客户端渲染优化、以及静态资源体积的减少。然而，对于许多用户进入网站的第一个页面（如首页），网络开销也是一个不容忽视的问题。

由于新用户可能从未与网站建立连接，从DNS查询到TCP连接，再到下载服务器返回的内容，这些步骤的耗时通常远远超过服务器的响应时间。而多数情况下开发者无法通过代码优化来减少这部分时间消耗。

为了解决新用户访问网站时可能遇到的网络开销问题，我们可以借助多种预加载技术在用户实际需要之前提前加载资源，从而减少等待时间，实现更流畅的用户体验。接下来本文将详细探讨几种常见的预加载方法，并在 prefetch 、 preload 等基础上，结合流式渲染、HTTP Early Hints、HTTP/2 push 等技术，对预加载技术灵活运用，从而在用户到达网站的瞬间就提供无缝、快速的访问体验。

CDN 动态加速

在开始介绍预加载之前，其实开发者可以通过 CDN 动态加速优化用户与服务器的建连、内容传输时间。CDN 通常被用来加速静态资源的传输，比如图像、JavaScript 和 CSS，这个大部分开发者非常熟悉，但现代的 CDN 技术已经不仅仅局限于静态内容的优化，大部分 CDN 厂商可以利用其全球广泛分布的边缘节点服务器为网站提供动态内容的访问加速。

用户访问网站动态内容需要通过互联网连接到源站服务器，这个过程中数据需要经过多个网络节点和长距离传输，容易受到各种网络拥塞和延迟的影响。

使用 CDN 动态加速时，CDN 通过在全球分布的边缘节点缓存和处理用户请求，显著缩短了从用户到服务器的物理距离，减少了传输延迟。同时 CDN 服务商会实时监控全球的网络状态，通过智能路由技术选择当前最优的路径传输数据，这避免了网络中的拥塞和瓶颈，确保数据以最快的速度传输到用户端。

当然如果使用了 CDN 提供的边缘计算能力，可以让用户直接从 CDN 边缘节点获取动态内容，进一步加速动态内容的访问。

dns-prefetch DNS 预解析

当浏览器需要访问特定域名时，必须先将先将域名解析为 IP 地址，这一步骤就是 DNS 解析。 dns -prefetch 可以让浏览器提前在后台完成这一解析工作，避免用户在实际请求资源时等待 DNS 解析的时间。

在 HTML 顶部通过标签来指示浏览器对接下来要是用的静态资源、动态接口等域名提前进行 DNS 解析。

"dns-prefetch" href="//example.com">

preconenct 域名预建连

当浏览器解析了域名后，接下来需要通过TCP协议和服务器建立连接，并在使用 HTTPS 的情况下进行 TLS 握手，这些步骤通常需要较多往返时间（RTT）。 preconnect 通过提前完成这些连接步骤，可以减少用户真正需要请求资源时的等待时间。

可以在HTML中通过标签来指示浏览器进行预连接，使用 preconnect 之后浏览器不仅会解析域名的 DNS，还会提前与服务器建立 TCP 连接，并完成 TLS 握手。

"preconnect" href="//example.com">

preload 与 prefetch 预加载

除了对域名进行解析、建连，还可以通过 preload 和 prefetch 对页面将要使用的资源提前下载。

preload 是一种声明式资源引入方式，用来强制浏览器在合适的时机加载指定资源，通常用于关键资源（如字体、脚本、样式表等）的预加载，以确保这些资源能够尽快被使用。

"preload" href="styles.css" as="style">"preload" href="main.js" as="script">"preload" href="image.jpg" as="image">

prefetch 同样是一种声明式资源请求方式，用于提示浏览器在空闲时下载未来可能用到的资源，适合作为页面未来使用的资源或者当前页面下一跳页面要使用的资源预加载。

"prefetch" href="next-page-image.jpg">"prefetch" href="next-page-script.js">

两个标签在优先级上有一定的区别：

preload ：具有高优先级，浏览器会立即加载这些资源；
prefetch ：具有较低优先级，只有在浏览器空闲时才会加载这些资源，确保不妨碍当前页面的正常加载；

两者在浏览器支持上各有千秋：

preload	prefetch

prerender 预渲染

使用 prerender 可以将目标页面上近乎所有资源（HTML、CSS、JavaScript、图像等）和内容在后台提前下载并渲染，浏览器在用户首次访问该页面之前已经完全准备好了该页面的视图。这样当用户跳转到该页面时，使用户在实际跳转到这个页面时能够立即呈现，不需要再等待加载和渲染的时间。

"prerender" href="https://example.com/next-page">

听起来 prerender 是预加载的终极方案了，但在实际性能优化方案中却很少被使用，使用 preload 有几个弊端：

不能命中时候资源开销过大： 因为 prerender 会对页面进行资源下载和渲染，当页面没有被用户访问时候造成的资源浪费过大；
影响页面数据统计： 大部分页面在执行时候会对页面进行数据上报用作后续的页面效果分析，部分页面会有展示广告等行为，如果 prerender 后用户没有访问页面，会造成数据统计上的混乱；
浏览器兼容性问题： 不同的浏览器对于 prerender 的实现细节可能有所不同。例如，一些浏览器可能出于性能或安全考虑，会对预渲染的资源类型进行某些限制；

根据用户行为 prefetch 下一跳页面

无脑对页面进行 prefetch 会造成巨大的资源浪费，但很多时候我们可以根据用户行为更精准的预测用户接下来的动作，再进行 prefetch 可以很大程度上减少资源浪费。

举个例子，在 PC 页面当用户鼠标悬停在某个商品图片上时候，我们可以大胆预测用户及大概率要点击页面，这时候可以对页面进行 prefetch。如果希望进一步细化，用户点击鼠标的动作会依次触发 mousedown 、 mouseup 、 click 事件，我们可以在 mousedown 事件中对页面进行预载，这样可以节省人点击鼠标的 200ms 左右。

function App() {  return (    "App">      Product List      "product-list">        "1" name="Product 1" imageUrl="https://via.placeholder.com/150" prefetchUrl="/next-page-1" />        "2" name="Product 2" imageUrl="https://via.placeholder.com/150" prefetchUrl="/next-page-2" />        "3" name="Product 3" imageUrl="https://via.placeholder.com/150" prefetchUrl="/next-page-3" />            );}
const Product = ({ id, name, imageUrl, prefetchUrl, delay=200 }) => {  const [prefetchTimeout, setPrefetchTimeout] = useState(null);
  const handleMouseOver = () => {    const timeout = setTimeout(() => {      const link = document.createElement('link');      link.rel = 'prefetch';      link.href = prefetchUrl;      link.credentials = 'include';      document.head.appendChild(link);    }, delay);
    // 防止用户快速    setPrefetchTimeout(timeout);  };
  const handleMouseOut = () => {    // 如果过度发 prefetch 请求    clearTimeout(prefetchTimeout);  };
  return (    "product"         onMouseOver={handleMouseOver}         onMouseOut={handleMouseOut}>      "lazy" />      {name}      );}

添加 credentials 属性，携带 cookie

安全原因 prefetch 请求默认不携带 cookie，为了让 prefetch 请求携带 cookie，可以在 prefetch 的 link 标签中添加 credentials 属性，并将其设置为 "include"。

"prefetch" href="..." as="script" credentials="include">

服务器设置缓存

因为大部分动态页面为了给用户传输动态内容是禁用客户端缓存的，所以即使发了 prefetch 请求也无法做到用户真实点击的时候复用 prefetch 请求，反而会重新发请求造成资源浪费。

因此需要在服务端识别 prefetch 请求，设置短时间的客户端缓存，当用户很快真实访问 prefetch 的页面后可以复用缓存。

浏览器发送的 prefetch 请求会携带 HTTP Header Sec-Purpose : prefetch 或 Purpose: prefetch ，服务端根据这个属性识别 prefetch 请求。

app.get('/next-page', (req, res) => {  const purposeHeader = req.headers['purpose'] || req.headers['sec-purpose'];  if (purposeHeader === 'prefetch') {    res.set('Cache-Control', 'max-age=10'); // 设置缓存策略    console.log('Prefetch request detected, setting cache.');  } else {    console.log('Regular request detected, no cache.');  }  res.send(`    Next Page Content    This is the next page that was prefetched.
`  );});

页面与首屏请求并行加载

上述方案在 SSR 页面效果显著，但在 CSR 页面可能优化效果有限，主要原因是 CSR 页面内容存储在 CDN 甚至客户端本地缓存，本身加载很快，页面的渲染主要依赖动态接口的返回。

如果我们可以知道页面首屏渲染需要发起的请求，其实可以利用和上面类似的原理，在用户点击页面的瞬间同时发起异步请求，当解析执行 JavaScript 脚本发送异步请求时可以判断本地已经有缓存，直接使用结果。

原理非常类似，不再代码演示，核心还是请求：

设置 credentials 请求可以携带 cookie；