专栏名称: OSC开源社区

OSChina 开源中国官方微信账号

深入理解Babel - 微内核架构与ECMAScript标准化

OSC开源社区 · 公众号 · 程序员 · 2024-09-10 17:17

主要观点总结

文章详细介绍了Babel的设计思路、微内核架构、标准化等方面的信息，同时解释了Babel在转译过程中的作用，并对比了其与ECMAScript标准的配合。Babel作为一个JavaScript转译器，允许开发者使用下一代ECMAScript语法，并将其转译为低版本语法以便在各种环境中运行。文章还讨论了Babel的生命周期、微内核架构、标准化组织以及阅读ECMAScript的方法。

关键观点总结

关键观点1: Babel简介

Babel是JavaScript转译器，开发者可自由使用下一代ECMAScript语法，并通过Babel转译为低版本语法以便运行在不同环境中。

关键观点2: Babel微内核架构

Babel采用微内核架构，内核保留核心功能，其余功能通过外部工具和插件机制实现，体现了'开放-封闭'的设计原则。

关键观点3: 标准化

Babel遵循ECMAScript和Web标准，如ECMAScript的标准化组织TC39负责迭代和发展ECMAScript，而Web标准由W3C/WHATWG制定。

关键观点4: 转译过程

Babel的生命周期包括解析、转换、代码生成三个阶段，涉及抽象语法树(AST)的生成和修改。

关键观点5: 阅读ECMAScript

开发者可通过ECMAScript的规格文档了解JavaScript的发展历史、更新内容、全局对象、保留字等，以便解决相关问题。

正文

一、Babel简介

1. Babel是什么

2. 转译过程

二、Babel微内核架构

1. 微内核架构

2. 转译模块

3. 插件模块

4. 工具模块

5. 运行时相关模块

三、标准化

1. ECMAScript

2. 如何阅读 ECMAScript

3. web标准

四、总结

随着浏览器版本的持续更新，浏览器对JavaScript的支持越来越强大，Babel的重要性显得较低了。但Babel的设计思路、背后依赖的ECMAScript标准化思想仍然值得借鉴。

本文涉及的Babel版本主要是V7.16及以下，截至发文时，Babel最新发布的版本是V7.25.6，未出现大版本更新，近2年也进入了稳定迭代期，本文的分析思路基本适用目前的Babel设计。

一

Babel简介

Babel是什么

Babel是JavaScript转译器，通过Babel，开发者可以自由使用下一代ECMAScript 语法。高版本ECMAScript语法将被转译为低版本语法，以便顺利运行在各类环境，如低版本浏览器、低版本 Node.js 等。

Babel 是转译器，不是编译器。下面是转译和编译的区别:

编译，一般指将一种语言转换为另一种语法和抽象程度等都不同的语言，常见的比如 gcc 编译器。

转译，一般指将一种语言转换为不同版本或者抽象程度相同的语言，比如 Babel 可以把 ECMAScript 6 语法转译为 ECMAScript 5语法。

利用 Babel，开发者可以使用 ECMAScript 的各种新特性进行开发，同时花极少的精力关注浏览器或其他JS运行环境对新特性的支持。甚至，开发者可以根据自身需要，创造属于自己的 JavaScript 语法。

Babel在转译的时候，会对源码进行以下处理: 语法转译(Syntax)和添加API Polyfill。

语法(Syntax)部分
Babel 支持识别高版本语法，并通过插件将源码从高版本语法转译为低版本语法，如:

箭头函数 () => {} 转为普通函数 function() {}。
const / let 转译为var

API Polyfill
有些运行时相关的 API，语法转译无法解决它们对低版本浏览器等环境的兼容性问题，因此 Babel 通过与 core-js 等工具的配合，实现 API 部分对目标环境(通常是低版本浏览器等)的兼容。
例如[1, 2, 3].include、Promise等 API，Babel 在处理时，如果目标环节可能不支持原生的 include / Promise 的话，Babel 会在转译结果中嵌入 include / Promise 的自定义实现。
有多种方式可以使用 Babel，如: 命令行(babel-cli、babel-node)、浏览器(babel-standalone)、API 调用(babel-core)、webpack loader(babel-loader)等。

转译过程

和多数转译器相同，Babel 运行的生命周期主要是 3 个阶段: 解析、转换、代码生成。

这个过程涉及抽象语法树:

抽象语法树(Abstract Syntax Tree，AST)，或简称语法树(Syntax tree)，是源代码语法结构的一种抽象表示。

AST 是树形对象，以结构化的形式表示编程语言的语法结构，树上的每个节点都表示源代码中的一种结构。

源码字符串需要经转译器生成 AST，转译器有很多种，不同转译器，生成的AST对象格式细节可能有差异，但共同点为: 都是树形对象、该树形对象描述了节点特征、各节点之间的关系（兄弟、父子等）。

以下是 Babel 生命周期的三个过程:

解析(Parsing): Code1 ==> 抽象语法树1
解析过程包括 2 个环节: 词法解析、语法解析，最终生成抽象语法树。
词法解析阶段，代码字符串被解析为 token 令牌数组，数组项是一个对象，包括: 代码字符碎片的值、位置、类型等信息。
token 数组是平铺式的数组，没有嵌套的结构信息，它是为语法解析阶段做准备的。
语法解析阶段，token 令牌数组被解析为结构化的抽放语法树对象(AST)。
babel-parser 完成该阶段的主要功能。

转换(Transformation): AST1 ==> AST2
Babel 生成 AST 后，会对 AST 进行遍历，遍历过程中，各类插件对原 AST 对象进行增删改查等操作，AST 结构被修改。

代码生成(Generation): AST2 ==> Code2
Babel 将修改后的 AST 对象转目标代码字符串。

babel-generator 完成该阶段的主要功能。

二

Babel微内核架构

微内核架构

Babel 采用微内核架构，其内核保留核心功能，其余功能利用外部工具和插件机制实现，也体现了"开放-封闭"的设计原则。

除了微内核设计架构，Babel 的模块设计也可以做如下分类:

转译模块

转译模块位于 Babel 微内核架构的"微内核"部分，该部分主要负责代码转译，也就是上面提到的"解析-转换-代码生成"过程。

该模块主要包括: babel-parser、babel-traverse、babel-generator。

babel-parser
负责将代码字符串转为 AST 对象。
有 2 点值得一提:

babel-parser 本身并不会对 AST 做转换操作，只是负责解析出 AST。AST 转换部分交由各类 plugins 和 presets 处理。
babel-parser 内置了对 ESNext/TypeScript/JSX/Flow 最新版本语法的支持，但很多默认是不开启的，目前没有开放插件机制扩展新语法。

babel-traverse
在转译过程中，babel-traverse 负责遍历 AST 节点，并根据配置的 plugins/presets，在遍历过程中，对各个 AST 节点进行增删改查的操作。
AST 是一个树形对象，遍历 AST 对象的过程也是一个深度优先遍历的过程。

babel-generator
负责将 AST 节点，转为代码字符串，同时也可以生成 source-map。

插件模块

插件模块包括 plugins、presets。

plugins
丰富的插件，帮助 Babel 成为一个非常成功的转译工具。
对 AST 的遍历、转换是 Babel 转译的核心功能，但 Babel 本身并不参与该过程，将这些功能作为插件引入到运行时。
具体来说，babel-core 作为核心工具，不提供对 AST 的修改逻辑，通过调用各类插件，实现对 AST 的修改。
Babel的插件分为语法插件和转换插件。

语法插件

值得注意的是，babel-parser 负责将 JavaScript 代码解析出抽象语法树(AST)，它支持全面识别 ESNext/TypeScript/JSX/Flow 等语法，目前由 Babel 团队开发维护，不支持插件化。

Babel 插件生态中的语法插件，其功能就是作为"开关"，配置是否开启 babel-parser 的某些语法转译功能。

语法插件在 Babel 源码中，以 babel-plugin-syntax 开头。

举个例子:

babel-plugin-syntax-decorators
负责开启 babel-parser 对装饰器的语法支持。
babel-plugin-syntax-dynamic-import
负责开启 babel-parser 对 import 语句的语法支持。
babel-plugin-syntax-jsx
负责开启 babel-parser 对 jsx 语法的支持。

转换插件

转换插件就是社区里常说的 Babel 插件，负责转换 AST 节点。
在介绍babel-traverse时提到，它负责遍历AST对象，每个AST节点会被访问到，等待转换，转换的部分，由"转换插件"负责。
转换插件会提供一个叫做"Visitor"的对象，该对象的 Key 为节点名称，Value 部分提供进入该节点时、离开该节点时的回调函数，在回调函数里，可以对该节点进行一系列操作。
"Visitor" 又称为 "访问者"。

// plugin 提供 visitor，在 visitor 中对 AST 节点操作const visitor = {    Program: {        enter() {},        exit() {},    },
    CallExpression: {        enter() {},        exit() {},    },
    NumberLiteral: {        enter() {},        exit() {},    }};traverse(ast, visitor);

转换插件在Babel源码中，以 babel-plugin-transform 开头。

举个例子:

babel-plugin-transform-strict-mode

该插件拦截 Program 节点，也就是整个程序的根节点，添加 "use strict"指令。

visitor 节点值为函数时，是 enter 回调的快捷方式。

{    name: "transform-strict-mode",
    visitor: {      Program(path) {        const { node } = path;
        for (const directive of node.directives) {          if (directive.value.value === "use strict") return;        }
        path.unshiftContainer(          "directives",          t.directive(t.directiveLiteral("use strict")),        );      },    },  };}

babel-plugin-transform-object-assign

该插件负责拦截函数调用表达式节点 CallExpression，将 Object.assign 转为 extends 写法。

{    name: "transform-object-assign",
    visitor: {      CallExpression(path, file) {        if (path.get("callee").matchesPattern("Object.assign")) {          path.node.callee = file.addHelper("extends");        }      },    },}

Presets
Babel 插件的功能是细粒度的，大部分插件承担了单一功能。
而在实际开发过程中，往往需要支持对各类语法的支持。此时，有两种做法:

需要支持哪些特性，就分别引入支持该特性的插件
直接引入一个插件集合，涵盖所需的各类插件功能

很显然，第一种做法是相对麻烦的。针对第二种做法，Babel提供了插件集 preset。

preset 在 Babel 源码中，以 babel-preset 开头。

例如，Babel 已经提供了几种常用的 preset 供开发者使用:

babel-preset-env
babel-preset-react
babel-preset-flow
babel-preset-typescript

插件运行顺序
Babel 配置项中，plugins 和 presets 均以数组的形式配置，执行时有先后顺序。

plugins 在 presets之前运行
plugins 按照数组正序执行
presets 按照数组倒序执行

工具模块

工具模块提供 Babel 相关模块所需的各类工具，以下一一简要介绍:

babel-core
babel-core 对外提供了 Babel 多项功能的 API，如转译文件、转译代码、创建/获取配置等，在 Babel 官方文档介绍的比较详细，不再赘述。
值得注意的是，转译类的 API 均提供了同步和异步版本，如 transformSync/transfomAsync、parseSync/parseAsync。

babel-cli
Babel 的命令行工具，可以直接转译文件夹/文件，它也提供了很多配置项做其他工作，官方文档介绍的比较详细，感兴趣的同学可以去 Babel 官网查看详细配置。

babel-standalone
Babel 对外服务的很多包是基于 node 环境下使用的，babel-standalone 提供了浏览器下转译的方案。
babel-standalone 内置了所有 Babel 插件，所以体积还是比较大的，而且在浏览器端转译需要时间，比较适合开发、学习使用，不适合在生产环境使用。
举个例子:

<html>  <head>    <meta charset="utf-8" />    <title>test babel-standalonetitle>    <script src="https://unpkg.com/@babel/standalone/babel.min.js">script>    <script type="text/babel">      const arr = [1, 2, 3];      console.log(...arr);script>  head>  <body>body>html>

在浏览器运行该 html，可以看到，页面结构变成了:

<html>  <head>    <meta charset="utf-8" />    <title>test babel-standalonetitle>    <script src="https://unpkg.com/@babel/standalone/babel.min.js">script>    <script type="text/babel">      const arr = [1, 2, 3];      console.log(...arr);script>    <script>      "use strict";      var _console;      var arr = [1, 2, 3];      (_console = console).log.apply(_console, arr); //# sourceMappingURL=data:application/json;charset=utf-8;base64...script>  head>  <body>body>html>

babel-node

提供在命令行执行高级语法的环境。

例如:

// index.js 里可以使用高级语法     babel-node -e index.js

index.js 文件以及被其引入的其他文件均可以使用高级语法了。和 babel-cli 不同的是，babel-cli 只负责转换，不在 node 运行时执行；babel-node 会在 node 运行时执行转换，不适合生产环境使用。

babel-register

在源文件中，引入babel-register，如 index.js:

index.js

require('babel-register');     require('./run');

run.js

import fs from 'fs';     console.log(fs);

执行 node index 时，run.js 就不需要被转码了。

babel-register 通过拦截 node require 方法，为 node 运行时引入了 Babel 的转译能力。

babel-loader

babel-loader 是利用 babel-core 的 API 封装的 webpack loader，用于 webpack 构建过程。

babel-types

babel-types 是一个非常强大的工具集合，它集成了节点校验、增删改查等功能，是 Babel 核心模块开发、插件开发等场景下不可或缺的工具。

例如:

const t = require('@babel/types');const binaryExpression = t.binaryExpression('+', t.numericLiteral(1), t.numericLiteral(2));

babel-template

模板引擎，负责将代码字符串转为 AST 节点对象。

    import { smart as template } from '@babel/template';    import generate from '@babel/generator';    import * as t from '@babel/types';
    const buildRequire = template(      var %%importName%% = require(%%source%%);    );
    const ast = buildRequire({        importName: t.identifier('myModule'),        source: t.stringLiteral("my-module"),    });
    const code = generate(ast).code
    console.log(code)

运行结果:

var myModule = require("my-module");

babel-code-frame

负责打印出错的代码位置，例如:

const { codeFrameColumns } = require('@babel/code-frame');
const testCode = `class Run {    constructor() {}}`;
const location = {    start: {        line: 2,        column: 2,    }};
const result = codeFrameColumns(testCode, location);
console.log(result);

  1 | class Run {> 2 |     constructor() {}    |  ^  3 | }  4 |

babel-highlight

向控制台输出有颜色的代码片段。该工具可以识别 JavaScript 中的操作符号、标识符、保留字等类型的词法单元，并在终端环境下显示不同的颜色。

运行时相关模块

Babel 配合其插件可以对静态代码进行转译，但有一些遗漏点:

对于运行时涉及的一些高版本 API，并没有提供兼容目标环境的 Polyfill。
转译产物代码可能有些臃肿。

为此，运行时模块(runtime)关注的是转译产物的运行时环境，对运行时提供 API polyfill、代码优化等，该模块涉及几个子包:

babel-preset-env
babel-plugin-transform-runtime
babel-runtime
babel-runtime-corejs2/3
core-js

接下来以案例解释 runtime 模块的作用。

源码文件 index.js 的内容:

const a = 1; // const 为语法部分class Base {} // class 为语法部分new Promise() // Promise 为 API 部分

这段源码包含了语法和 API 部分:

const、class 为语法部分
Promise 为 API 部分

如果希望这段源码转为 ES5 版本，使构建产物可以运行在不支持 ES6 和 Promise 的环境里，该怎么做呢？

用 babel 命令行执行转译，其中源文件为 index.js，转译产物文件为 index-compiled.js。

npx babel index.js --out-file index-compiled.js

需要配置.babelrc 帮助 Babel 完成语法和 API 部分的转译:

.babelrc:

{    "presets": [        [             "@babel/preset-env"        ]    ],    "plugins": [        [            "@babel/plugin-transform-runtime",            {                "corejs": 3            }        ]    ]}

简要解释下该配置的原理:

babel-preset-env 可以完成语法部分转译，即 const 转译为var
但构建产物中，有些辅助代码如 _classCallCheck 是以硬编码的形式直接写入转译产物的:

"use strict";
    function _classCallCheck(instance, Constructor) { if (!(instance instanceof Constructor)) { throw new TypeError("Cannot call a class as a function"); } }
    var a = 1;
    var Base = function Base() {        _classCallCheck(this, Base);    };
    new Promise();

这样的后果就是构建产物比较臃肿。

babel-plugin-transform-runtime 可以将上述 _classCallCheck 置于通用包中，以引用的形式写入转译产物:

"use strict";
    var _interopRequireDefault = require("@babel/runtime/helpers/interopRequireDefault");
    var _classCallCheck2 = _interopRequireDefault(require("@babel/runtime/helpers/classCallCheck"));
    var a = 1;
    var Base = function Base() {        (0, _classCallCheck2["default"])(this, Base);    };
    new Promise();

babel-plugin-transform-runtime 的配置参数 corejs 用于转译 API 部分，如 Promsie

    "use strict";
    var _interopRequireDefault = require("@babel/runtime-corejs3/helpers/interopRequireDefault");
    var _promise = _interopRequireDefault(require("@babel/runtime-corejs3/core-js-stable/promise"));
    var _classCallCheck2 = _interopRequireDefault(require("@babel/runtime-corejs3/helpers/classCallCheck"));
    var a = 1;
    var Base = function Base() {        (0, _classCallCheck2["default"])(this, Base);    };
    new _promise"default";

Babel 转译过程的运行时优化是一个繁琐的过程，为此将单独用一章讲解运行时优化，感兴趣的同学可以直接阅读 "Babel Runtime" 章节详细了解。

三

标准化

Babel 生态涉及的一些标准化组织。无论是 JavaScript、HTML、DOM、URL 等领域，均需要统一的标准，才能在不同的运行环境下有统一的表现。Babel 转译也需要遵循这些标准，包括 ECMAScript、web标准等。

ECMAScript

JavaScript诞生

1995 年，JavaScript 的第一个版本发布。用时间线的方式描述 JavaScript 的诞生过程会更清晰:

ECMAScript发布

1996 年，微软模仿 JavaScript 实现了 JScript 并内置在 IE3.0，随后，Netscape 公司着手推动 JavaScript 标准化。

这里涉及几个组织:

Ecma International

Ecma International 是一家国际性会员制度的信息和电信标准组织。1994年之前，名为欧洲计算机制造商协会（European Computer Manufacturers Association）。因为计算机的国际化，组织的标准牵涉到很多其他国家，因此组织决定改名表明其国际性。

Ecma International 的任务包括与有关组织合作开发通信技术和消费电子标准、鼓励准确的标准落实、和标准文件与相关技术报告的出版。

Ecma International 负责多个国际标准的制定:

CD-ROM 格式（之后被国际标准化组织批准为ISO 9660）
C# 语言规范
C++/CLI 语言规范
通用语言架构（CLI）
Eiffel 语言
电子产品环境化设计要素
Universal 3D 标准
OOXML
Dart 语言规范
ECMAScript 语言规范（以 JavaScript 为基础）ECMA-262
其中就包括 JavaScript 标准语言规范 ECMAScript。
cma International 拥有 ECMAScript 的商标。