专栏名称: JavaScript
面向JavaScript爱好人员提供:前端最新资讯、原创内容、JavaScript、HTML5、Ajax、jQuery、Node.js等一系列教程和经验分享。
目录
相关文章推荐
51好读  ›  专栏  ›  JavaScript

Webpack 是怎样运行的?

JavaScript  · 公众号  · Javascript  · 2019-05-29 10:24

正文

在平时开发中我们经常会用到  Webpack这个时下最流行的前端打包工具。它打包开发代码,输出能在各种浏览器运行的代码,提升了开发至发布过程的效率。

我们知道一份 Webpack配置文件主要包含入口( entry)、输出文件( output)、模式、加载器( Loader)、插件( Plugin)等几个部分。但如果只需要组织 JS 文件的话,指定入口和输出文件路径即可完成一个迷你项目的打包。下面我们来通过一个简单的项目来看一下 Webpack是怎样运行的。

同步加载

本文使用 webpack ^4.30.0 作示例.为了更好地观察产出的文件,我们将模式设置为 development 关闭代码压缩,再开启 source-map 支持原始源代码调试。除此之外。我们还简单的写了一个插件 MyPlugin来去除源码中的注释。

新建 src/index.js

  1. console.log('Hello webpack!');

新建 webpack配置文件 webpack.config.js

  1. const path = require('path');

  2. const MyPlugin = require('./src/MyPlugin.js')


  3. module.exports = {

  4. mode: 'development',

  5. devtool: 'source-map',

  6. entry: './src/index.js',

  7. output: {

  8. path: path.resolve(__dirname, 'dist')

  9. },

  10. plugins:[

  11. new MyPlugin()

  12. ]

  13. };

新建 src/MyPlugin.js。了解webpack插件更多信息

  1. class MyPlugin {

  2. constructor(options) {

  3. this.options = options

  4. this.externalModules = {}

  5. }


  6. apply(compiler) {

  7. var reg = /("([^\\\"]*(\\.)?)*")|('([^\\\']*(\\.)?)*')|(\/{2,}.*?(\r|\n))|(\/\*(\n|.)*?\*\/)|(\/\*\*\*\*\*\*\/)/g

  8. compiler.hooks.emit.tap('CodeBeautify', (compilation)=> {

  9. Object.keys(compilation.assets).forEach((data)=> {

  10. let content = compilation.assets[data].source() // 欲处理的文本

  11. content = content.replace(reg, function (word) { // 去除注释后的文本

  12. return /^\/{2,}/.test(word) || /^\/\*!/.test(word) || /^\/\*{3,}\//.test(word) ? "" : word;

  13. });

  14. compilation.assets[data] = {

  15. source(){

  16. return content

  17. },

  18. size(){

  19. return content.length

  20. }

  21. }

  22. })

  23. })

  24. }

  25. }

  26. module.exports = MyPlugin

现在我们运行命令 webpack --config webpack.config.js ,打包完成后会多出一个输出目录 dist: dist/main.js。 main 是 webpack 默认设置的输出文件名,我们快速瞄一眼这个文件:

  1. (function(modules){

  2. // ...

  3. })({

  4. "./src/index.js": (function(){

  5. // ...

  6. })

  7. });

整个文件只含一个立即执行函数 IIFE,我们称它为 webpackBootstrap,它仅接收一个对象 —— 未加载的 模块集合( modules),这个 modules 对象的 key 是一个路径, value 是一个函数。你也许会问,这里的模块是什么?它们又是如何加载的呢?
在细看产出代码前,我们先丰富一下源代码:
新文件 
src/utils/math.js

  1. export const plus = (a, b) => {

  2. return a + b;

  3. };

修改 src/index.js

  1. import { plus } from './utils/math.js';


  2. console.log('Hello webpack!');

  3. console.log('1 + 2: ', plus(1, 2));

我们按照 ES 规范的模块化语法写了一个简单的模块 src/utils/math.js,给 src/index.js 引用。Webpack 用自己的方式支持了 ES6 Module 规范,前面提到的 module 就是和 ES6 module 对应的概念。

接下来我们看一下这些模块是如何通 ES5 代码实现的。再次运行命令 webpack  --config webpack.config.js后查看输出文件:

  1. (function(modules){

  2. // ...

  3. })({

  4. "./src/index.js": (function(){

  5. // ...

  6. }),

  7. "./src/utils/math.js": (function() {

  8. // ...

  9. })

  10. });

IIFE 传入的 modules 对象里多了一个键值对,对应着新模块 src/utils/math.js,这和我们在源代码中拆分的模块互相呼应。然而,有了 modules 只是第一步,这份文件最终达到的效果应该是让各个模块按开发者编排的顺序运行。

探究 webpackBootstrap

接下来看看 webpackBootstrap 函数中有些什么:

  1. // webpackBootstrap

  2. (function(modules){


  3. // 缓存 __webpack_require__ 函数加载过的模块

  4. var installedModules = {};


  5. /**

  6. * Webpack 加载函数,用来加载 webpack 定义的模块

  7. * @param {String} moduleId 模块 ID,一般为模块的源码路径,如 "./src/index.js"

  8. * @returns {Object} exports 导出对象

  9. */

  10. function __webpack_require__(moduleId) {

  11. // ...

  12. }


  13. // 在 __webpack_require__ 函数对象上挂载一些变量及函数 ...


  14. // 传入表达式的值为 "./src/index.js"

  15. return __webpack_require__(__webpack_require__.s = "./src/index.js");

  16. })(/* modules */);

可以看到其实主要做了两件事:

  1. 定义一个模块加载函数 __webpack_require__

  2. 使用加载函数加载入口模块 "./src/index.js"

整个 webpackBootstrap 中只出现了入口模块的影子,那其他模块又是如何加载的呢?我们顺着 __webpack_require__("./src/index.js") 细看加载函数的内部逻辑:

  1. function __webpack_require__(moduleId) {

  2. // 重复加载则利用缓存

  3. if (installedModules[moduleId]) {

  4. return installedModules[moduleId].exports;

  5. }


  6. // 如果是第一次加载,则初始化模块对象,并缓存

  7. var module = installedModules[moduleId] = {

  8. i: moduleId, // 模块 ID

  9. l: false, // 模块加载标识

  10. exports: {} // 模块导出对象

  11. };


  12. /**

  13. * 执行模块

  14. * @param module.exports -- 模块导出对象引用,改变模块包裹函数内部的 this 指向

  15. * @param module -- 当前模块对象引用

  16. * @param module.exports -- 模块导出对象引用

  17. * @param __webpack_require__ -- 用于在模块中加载其他模块

  18. */

  19. modules[moduleId].call(module.exports, module, module.exports, __webpack_require__);


  20. // 模块加载标识置为已加载

  21. module.l = true;


  22. // 返回当前模块的导出对象引用

  23. return module.exports;

  24. }

首先,加载函数使用了闭包变量 installedModules,用来将已加载过的模块保存在内存中。 接着是初始化模块对象,并把它挂载到缓存里。然后是模块的执行过程,加载入口文件时 modules[moduleId] 其实就是 ./src/index.js 对应的模块函数。执行模块函数前传入了跟模块相关的几个实参,让模块可以导出内容,以及加载其他模块的导出。最后标识该模块加载完成,返回模块的导出内容。

根据 __webpack_require__  的缓存和导出逻辑,我们得知在整个 IIFE 运行过程中,加载已缓存的模块时,都会直接返回 installedModules[moduleId].exports,换句话说,相同的模块只有在第一次引用的时候才会执行模块本身。

模块执行函数

__webpack_require__ 中通过 modules[moduleId].call() 运行了模块执行函数,下面我们就进入到 webpackBootstrap 的参数部分,看看模块的执行函数。

  1. /*** 入口模块 ./src/index.js ***/

  2. "./src/index.js": (function (module, __webpack_exports__, __webpack_require__) {

  3. "use strict";

  4. // 用于区分 ES 模块和其他模块规范,不影响理解 demo,战略跳过。

  5. __webpack_require__.r(__webpack_exports__);

  6. /* harmony import */

  7. // 源模块代码中,`import {plus} from './utils/math.js';` 语句被 loader 解析转化。

  8. // 加载 "./src/utils/math.js" 模块,

  9. var _utils_math_js__WEBPACK_IMPORTED_MODULE_0__ = __webpack_require__("./src/utils/math.js");

  10. console.log('Hello webpack!');

  11. console.log('1 + 2: ', Object(_utils_math_js__WEBPACK_IMPORTED_MODULE_0__["plus"])(1, 2));

  12. }),


  13. "./src/utils/math.js": (function (module, __webpack_exports__, __webpack_require__) {

  14. "use strict";

  15. __webpack_require__.r(__webpack_exports__);

  16. /* harmony export (binding) */

  17. // 源模块代码中,`export` 语句被 loader 解析转化。

  18. __webpack_require__.d(__webpack_exports__, "plus", function () {

  19. return plus;

  20. });

  21. const plus = (a, b) => {

  22. return a + b;

  23. };

  24. })

执行顺序是:入口模块 -> 工具模块 -> 入口模块。入口模块中首先就通过 __webpack_require__("./src/utils/math.js") 拿到了工具模块的 exports 对象。再看工具模块, ES 导出语法转化成了 __webpack_require__.d(__webpack_exports__, [key], [getter]),而 __webpack_require__.d 函数的定义在 webpackBootstrap 内:

  1. // 定义 exports 对象导出的属性。

  2. __webpack_require__.d = function (exports, name, getter) {


  3. // 如果 exports (不含原型链上)没有 [name] 属性,定义该属性的 getter。

  4. if (!__webpack_require__.o(exports, name)) {

  5. Object.defineProperty(exports, name, {

  6. enumerable: true,

  7. get: getter

  8. });

  9. }

  10. };


  11. // 包装 Object.prototype.hasOwnProperty 函数。

  12. __webpack_require__.o = function (object, property) {

  13. return Object.prototype.hasOwnProperty.call(object, property);

  14. };

可见 __webpack_require__.d 其实就是 Object.defineProperty 的简单包装.
引用工具模块导出的变量后,入口模块再执行它剩余的部分。至此,Webpack 基本的模块执行过程就结束了。

好了,我们用流程图总结一下 Webpack 模块的加载思路:

异步加载

有上面的打包我们发现将不同的打包进一个 main.js 文件。 main.js 会集中消耗太多网络资源,导致用户需要等待很久才可以开始与网页交互。

一般的解决方式是:根据需求降低首次加载文件的体积,在需要时(如切换前端路由器,交互事件回调)异步加载其他文件并使用其中的模块。

Webpack 推荐用 ES import() 规范来异步加载模块,我们根据 ES 规范修改一下入口模块的 import 方式,让其能够异步加载模块:

src/index.js

  1. console.log('Hello webpack!');


  2. window.setTimeout(() => {

  3. import('./utils/math').then(mathUtil => {

  4. console.log('1 + 2: ' + mathUtil.plus(1, 2));

  5. });

  6. }, 2000);

工具模块 src/utils/math.js依然不变,在 webpack 配置里,我们指定一下资源文件的公共资源路径 publicPath,后面的探索过程中会遇到。

  1. const path = require('path');

  2. const MyPlugin = require('./src/MyPlugin.js')


  3. module.exports = {

  4. mode: 'development',

  5. devtool: 'source-map',

  6. entry: './src/index.js',

  7. output: {

  8. path: path.resolve(__dirname, 'dist'),

  9. publicPath: '/dist/'

  10. },

  11. plugins:[

  12. new MyPlugin()

  13. ]

  14. };

接着执行一下打包,可以看到除了 dist/main.js 外,又多了一个 dist/0.js ./src/utils/math.js。模块从 main chunk 迁移到了 0 chunk 中。而与 demo1 不同的是, main chunk 中添加了一些用于异步加载的代码,我们概览一下:

  1. // webpackBootstrap

  2. (function (modules) {

  3. // 加载其他 chunk 后的回调函数

  4. function webpackJsonpCallback(data) {

  5. // ...

  6. }


  7. // ...


  8. // 用于缓存 chunk 的加载状态,0 为已加载

  9. var installedChunks = {

  10. "main": 0

  11. };


  12. // 拼接 chunk 的请求地址

  13. function jsonpScriptSrc(chunkId) {

  14. // ...

  15. }


  16. // 同步 require 函数,内容不变

  17. function __webpack_require__(moduleId) {

  18. // ...

  19. }


  20. // 异步加载 chunk,返回封装加载过程的 promise

  21. __webpack_require__.e = function requireEnsure(chunkId) {

  22. // ...

  23. }


  24. // ...


  25. // defineProperty 的包装,内容不变

  26. __webpack_require__.d = function (exports, name, getter) {}


  27. // ...


  28. // 根据配置文件确定的 publicPath

  29. __webpack_require__.p = "/dist/";


  30. /**** JSONP 初始化 ****/

  31. var jsonpArray = window["webpackJsonp"] = window["webpackJsonp"] || [];

  32. var oldJsonpFunction = jsonpArray.push.bind(jsonpArray);

  33. jsonpArray.push = webpackJsonpCallback;

  34. jsonpArray = jsonpArray.slice();

  35. for (var i = 0; i < jsonpArray.length; i++) webpackJsonpCallback(jsonpArray[i]);

  36. var parentJsonpFunction = oldJsonpFunction;

  37. /**** JSONP 初始化 ****/


  38. return __webpack_require__(__webpack_require__.s = "./src/index.js");

  39. })({

  40. "./src/index.js": (function(module, exports, __webpack_require__) {


  41. document.write('Hello webpack!\n');


  42. window.setTimeout(() => {

  43. __webpack_require__.e(/*! import() */ 0).then(__webpack_require__.bind(null, /*! ./utils/math */ "./src/utils/math.js")).then(mathUtil => {

  44. console.log('1 + 2: ' + mathUtil.plus(1, 2));

  45. });

  46. }, 2000);


  47. })

  48. })

可以看到 webpackBootstrap 的函数体部分增加了一些内容,参数部分移除了 "./src/utils/math.js" 模块。跟着包裹函数的执行顺序,我们先聚焦到 JSONP 初始化」部分:

  1. // 存储 jsonp 的数组,首次运行为 []

  2. var jsonpArray = window["webpackJsonp"] = window["webpackJsonp"] || [];


  3. // 保存 jsonpArray 的 push 函数,首次运行为 Array.prototype.push

  4. var oldJsonpFunction = jsonpArray.push.bind(jsonpArray);


  5. // 将 jsonpArray 的 push 重写为 webpackJsonpCallback (加载其他 chunk 后的回调函数)

  6. jsonpArray.push = webpackJsonpCallback;


  7. // 将 jsonpArray 重置为正常数组,push 重置为 Array.prototype.push

  8. jsonpArray = jsonpArray.slice();


  9. // 由于 jsonpArray 为 [],不做任何事

  10. for (var i = 0; i < jsonpArray.length; i++) webpackJsonpCallback(jsonpArray[i]);


  11. // Array.prototype.push

  12. var parentJsonpFunction = oldJsonpFunction;

初始化结束后,变化就是 window 上挂载了一个 webpackJsonp 数组,它的值为 [];此外,这个数组的 push 被改写为 webpackJsonpCallback 函数,我们在后面会提到这些准备工作的作用。

接着是 __webpack_require__ 入口模块,由于 __webpack_require__ 函数没有改变,我们继续观察入口模块执行函数有了什么变化。

显然, import('../utils/math.js') 被转化为 __webpack_require__.e(0).then (__webpack_require__.bind(null,"./src/utils/math.js"))。0 是 ./src/utils/math.js 所在 chunk 的 id,「同步加载模块」的逻辑拆分成了「先加载 chunk,完成后再加载模块」。

我们翻到 __webpack_require__.e 的定义位置:

  1. __webpack_require__.e = function requireEnsure(chunkId) {

  2. var promises = [];


  3. // installedChunks 是在 webpackBootstrap 中维护的 chunk 缓存

  4. var installedChunkData = installedChunks[chunkId];


  5. // chunk 未加载

  6. if(installedChunkData !== 0) {


  7. // installedChunkData 为 promise 表示 chunk 加载中

  8. if(installedChunkData) {

  9. promises.push(installedChunkData[2]);

  10. } else {

  11. /*** 首次加载 chunk: ***/

  12. // 初始化 promise 对象

  13. var promise = new Promise(function(resolve, reject) {

  14. installedChunkData = installedChunks[chunkId] = [resolve, reject];

  15. });

  16. promises.push(installedChunkData[2] = promise);


  17. // 创建 script 标签加载 chunk

  18. var head = document.getElementsByTagName('head')[0];

  19. var script = document.createElement('script');

  20. var onScriptComplete;


  21. // ... 省略一些 script 属性设置


  22. // src 根据 publicPath 和 chunkId 拼接

  23. script.src = jsonpScriptSrc(chunkId);


  24. // 加载结束回调函数,处理 script 加载完成、加载超时、加载失败的情况

  25. onScriptComplete = function (event) {

  26. script.onerror = script.onload = null; // 避免 IE 内存泄漏问题

  27. clearTimeout(timeout);

  28. var chunk = installedChunks[chunkId];


  29. // 处理 script 加载完成,但 chunk 没有加载完成的情况

  30. if(chunk !== 0) {

  31. // chunk 加载中

  32. if(chunk) {

  33. var errorType = event && (event.type === 'load' ? 'missing' : event.type);

  34. var realSrc = event && event.target && event.target.src;

  35. var error = new Error('Loading chunk ' + chunkId + ' failed.\n(' + errorType + ': ' + realSrc + ')');

  36. error.type = errorType;

  37. error.request = realSrc;


  38. // reject(error)

  39. chunk[1](error);

  40. }


  41. // 统一将没有加载的 chunk 标记为未加载

  42. installedChunks[chunkId] = undefined;

  43. }

  44. };


  45. // 设置 12 秒超时时间

  46. var timeout = setTimeout(function(){

  47. onScriptComplete({ type: 'timeout', target: script });

  48. }, 120000);


  49. script.onerror = script.onload = onScriptComplete;

  50. head.appendChild(script);


  51. /*** 首次加载 chunk ***/

  52. }

  53. }

  54. return Promise.all(promises);

  55. };





    请到「今天看啥」查看全文