专栏名称: 程序员大咖
为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源;提供最新最全的编程学习资料:PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。
目录
相关文章推荐
程序员小灰  ·  DeepSeek做AI代写,彻底爆了! ·  2 天前  
程序猿  ·  问问DeepSeek,你和ChatGPT谁厉 ... ·  2 天前  
程序员小灰  ·  DeepSeek创始人梁文峰牛逼的个人经历 ·  3 天前  
51好读  ›  专栏  ›  程序员大咖

从 JavaScript 作用域说开去

程序员大咖  · 公众号  · 程序员  · 2017-06-03 19:34

正文


目录


1.静态作用域与动态作用域

2.变量的作用域

3.JavaScript 中变量的作用域

4.JavaScript 欺骗作用域

5.JavaScript 执行上下文

6.JavaScript 中的作用域链

7.JavaScript 中的闭包

8.JavaScript 中的模块


静态作用域与动态作用域


在电脑程序设计中,作用域(scope,或译作有效范围)是名字(name)与实体(entity)的绑定(binding)保持有效的那部分计算机程序。不同的编程语言可能有不同的作用域和名字解析。而同一语言内也可能存在多种作用域,随实体的类型变化而不同。作用域类别影响变量的绑定方式,根据语言使用静态作用域还是动态作用域变量的取值可能会有不同的结果。


  • 包含标识符的宣告或定义;

  • 包含语句和/或表达式,定义或部分关于可运行的算法;

  • 嵌套嵌套或被嵌套嵌套。


原文中此处为链接,暂不支持采集

原文中此处为链接,暂不支持采集


原文中此处为链接,暂不支持采集

原文中此处为链接,暂不支持采集


作用域又分为两种,静态作用域和动态作用域。


静态作用域又叫做词法作用域,采用词法作用域的变量叫词法变量。词法变量有一个在编译时静态确定的作用域。词法变量的作用域可以是一个函数或一段代码,该变量在这段代码区域内可见(visibility);在这段区域以外该变量不可见(或无法访问)。词法作用域里,取变量的值时,会检查函数定义时的文本环境,捕捉函数定义时对该变量的绑定。


function f() {

function g() {

}

}


静态(词法)作用域,就是可以无须执行程序而只从程序源码的角度,就可以看出程序是如何工作的。从上面的例子中可以肯定,函数 g 是被函数 f 包围在内部。


大多数现在程序设计语言都是采用静态作用域规则,如C/C++、C#、Python、Java、JavaScript……


相反,采用动态作用域的变量叫做动态变量。只要程序正在执行定义了动态变量的代码段,那么在这段时间内,该变量一直存在;代码段执行结束,该变量便消失。这意味着如果有个函数f,里面调用了函数g,那么在执行g的时候,f里的所有局部变量都会被g访问到。而在静态作用域的情况下,g不能访问f的变量。动态作用域里,取变量的值时,会由内向外逐层检查函数的调用链,并打印第一次遇到的那个绑定的值。显然,最外层的绑定即是全局状态下的那个值。


function g() {

}


function f() {

g();

}


当我们调用f(),它会调用g()。在执行期间,g被f调用代表了一种动态的关系。


采用动态作用域的语言有Pascal、Emacs Lisp、Common Lisp(兼有静态作用域)、Perl(兼有静态作用域)。C/C++是静态作用域语言,但在宏中用到的名字,也是动态作用域。

变量的作用域


1. 变量的作用域


变量的作用域是指变量在何处可以被访问到。比如:


function foo(){

var bar;

}


这里的 bar 的直接作用域是函数作用域foo();


2. 词法作用域


JavaScript 中的变量都是有静态(词法)作用域的,因此一个程序的静态结构就决定了一个变量的作用域,这个作用域不会被函数的位置改变而改变。


3. 嵌套作用域


如果一个变量的直接作用域中嵌套了多个作用域,那么这个变量在所有的这些作用域中都可以被访问:


function foo (arg) {

function bar() {

console.log( 'arg:' + arg );

}

bar();

}


console.log(foo('hello'));   // arg:hello


arg的直接作用域是foo(),但是它同样可以在嵌套的作用域bar()中被访问,foo()是外部的作用域,bar()是内部作用域。


4. 覆盖的作用域


如果在一个作用域中声明了一个与外层作用域同名的变量,那么这个内部作用域以及内部的所有作用域中将会访问不到外面的变量。并且内部的变量的变化也不会影响到外面的变量,当变量离开内部的作用域以后,外部变量又可以被访问了。


var x = "global";


function f() {

var x = "local";

console.log(x);   // local

}


f();

console.log(x);  // global


这就是覆盖的作用域。


JavaScript 中变量的作用域


大多数的主流语言都是有块级作用域的,变量在最近的代码块中,Objective-C 和 Swift 都是块级作用域的。但是在 JavaScript 中的变量是函数级作用域的。不过在最新的 ES6 中加入了 let 和 const 关键字以后,就变相支持了块级作用域。到了 ES6 以后支持块级作用域的有以下几个:


with 语句


用 with 从对象中创建出的作用域仅在 with 声明中而非外 部作用域中有效。


try/catch 语句


JavaScript 的 ES3 规范中规定 try/catch 的 catch 分句会创建一个块作用域,其中声明的变量仅在 catch 内部有效。


let 关键字


let关键字可以将变量绑定到所在的任意作用域中(通常是{ .. }内部)。换句话说,let 为其声明的变量隐式地了所在的块作用域。


const 关键字


除了 let 以外,ES6 还引入了 const,同样可以用来创建块作用域变量,但其值是固定的 (常量)。之后任何试图修改值的操作都会引起错误。


这里就需要注意变量和函数提升的问题了,这个问题在前一篇文章里面详细的说过了,这里不再赘述了。


不过这里还有一个坑,如果赋值给了一个未定义的变量,会产生一个全局变量。


在非严格模式下,不通过 var 关键字直接给一个变量赋值,会产生一个全局的变量


function func() { x = 123; }

func();

x

<123


不过在严格模式下,这里会直接报错。


function func() { 'use strict'; x = 123; }

func();


在 ES5 中,经常会通过引入一个新的作用域来限制变量的生命周期,通过 IIFE(Immediately-invoked function expression,立即执行的函数表达式)来引入新的作用域。


通过 IIFE ,我们可以


  • 避免全局变量,隐藏全局作用域的变量。

  • 创建新的环境,避免共享。

  • 保持全局的数据对于构造器的数据相对独立。

  • 将全局的数据附加到单例对象上。

  • 将全局数据附加到方法中。

JavaScript 欺骗作用域


(1). with 语句


with 语句被很多人都认为是 JavaScript 里面的糟粕( Bad Parts )。起初它被设计出来的目的是好的,但是它导致的问题多于它解决的问题。


with 起初设计出来是为了避免冗余的对象调用。


举个例子:


foo.a.b.c = 888;

foo.a.b.d = 'halfrost';


这时候用 with 语句就可以缩短调用:


with (foo.a.b) {

c = 888;

d = 'halfrost';

}


但是这种特性却带来了很多问题:


function myLog( errorMsg , parameters) {

with (parameters) {

console.log('errorMsg:' + errorMsg);

}

}


myLog('error',{});


myLog('error',{ errorMsg:'stackoverflow' });


可以看到输出就出现问题了,由于 with 语句,覆盖掉了第一个入参。通过阅读代码,有时候是不能分辨出这些问题,它也会随着程序的运行,导致发生不多的变化,这种对未来的不确定性就很容易出现

bug。


with 会导致3个问题:


  • 性能问题

变量查找会变慢,因为对象是临时性的插入到作用域链中的。


  • 代码不确定性

@Brendan Eich 解释,废弃 with 的根本原因不是因为性能问题,原因是因为“with 可能会违背当前的代码上下文,使得程序的解析(例如安全性)变得困难而繁琐”。


  • 代码压缩工具不会压缩 with 语句中的变量名


所以在严格模式下,已经严格禁止使用 with 语句。


Uncaught SyntaxError: Strict mode code may not include a with statement


如果还是想避免使用 with 语句,有两种方法:


  1. 用一个临时变量替代传进 with 语句的对象。

  2. 如果不想引入临时变量,可以使用 IIFE 。


(function () {

var a = foo.a.b;

console.log('Hello' + a.c + a.d);

}());


或者


(function (bar) {

console.log('Hello' + bar.c + bar.d);

}(foo.a.b));


(2). eval 函数


eval 函数传递一个字符串给 JavaScript 编译器,并且执行其结果。


eval(str)


它是 JavaScript 中被滥用的最多的特性之一。


var a = 12;

eval('a + 5')

<17


eval 函数以及它的亲戚( Function 、setTimeout、setInterval)都提供了访问 JavaScript 编译器的机会。


Function() 构造函数的形式比 eval() 函数好一点的地方在于,它令入参更加清晰。


new Function( param1, ...... , paramN, funcBody )



var f = new Function( 'x', 'y' , 'return x + y' );

f(3,4)

<7


用 Function() 的方式至少不用使用间接的 eval() 调用来确保所执行的代码除了其自己的作用域只能访问全局的变量。


在 Weex 的代码中,就还存在着 eval() 的代码,不过 Weex 团队在注释里面承诺会改掉。总的来说,最好应该避免使用 eval() 和 new Function() 这些动态执行代码的方法。动态执行代码相对会比较慢,并且还存在安全隐患。


再说说另外两个亲戚,setTimeout、setInterval 函数,它们也能接受字符串参数或者函数参数。当传递的是字符串参数时,setTimeout、setInterval 会像 eval 那样去处理。同样也需要避免使用这两个函数的时候使用字符串传参数。


eval 函数带来的问题总结如下:


  1. 函数变成了字符串,可读性差,存在安全隐患。

  2. 函数需要运行编译器,即使只是为了执行一个微不足道的赋值语句。这使得执行速度变慢。

  3. 让 JSLint 失效,让它检测问题的能力大打折扣。


JavaScript 执行上下文



这个事情要从 JavaScript 源代码如何被运行开始说起。


我们都知道 JavaScript 是脚本语言,它只有 runtime,没有编译型语言的 buildTime,那它是如何被各大浏览器运行起来的呢?


JavaScript 代码是被各个浏览器引擎编译和运行起来的。JavaScript 引擎的代码解析和执行过程的目标就是在最短时间内编译出最优化的代码。JavaScript 引擎还需要负责管理内存,负责垃圾回收,与宿主语言的交互等。流行的引擎有以下几种:


苹果公司的 JavaScriptCore (JSC) 引擎,Mozilla 公司的 SpiderMonkey,微软 Internet Explorer 的 Chakra (JScript引擎),Microsoft Edge 的 Chakra (JavaScript引擎) ,谷歌 Chrome 的 V8。



其中 V8 引擎是最著名的开源的引擎,它和前面那几个引擎有一个最大的区别是:主流引擎都是基于字节码的实现,V8 的做法非常极致,直接跳过了字节码这一层,直接把 JS 编译成机器码。所以 V8 是没有解释器的。(但是这都是历史,V8 现在最新版是有解释器的)



在2017年5月1号之后, Chrome 的 V8 引擎的v8 5.9 发布了,其中的 Ignition 字节码解释器将默认启动 :V8 Release 5.9 。v8 自此回到了字节码的怀抱。


V8 在有了字节码以后,消除 Cranshaft 这个旧的编译器,并让新的 Turbofan 直接从字节码来优化代码,并当需要进行反优化的时候直接反优化到字节码,而不需要再考虑 JS 源代码。去掉 Cranshaft 以后,就成了 Turbofan + Ignition 的组合了。



Ignition + TurboFan 的组合,就是字节码解释器 + JIT 编译器的黄金组合。这一黄金组合在很多 JS 引擎中都有所使用,例如微软的 Chakra,它首先解释执行字节码,然后观察执行情况,如果发现热点代码,那么后台的 JIT 就把字节码编译成高效代码,之后便只执行高效代码而不再解释执行字节码。苹果公司的 SquirrelFish Extreme 也引入了 JIT。SpiderMonkey 更是如此,所有 JS 代码最初都是被解释器解释执行的,解释器同时收集执行信息,当它发现代码变热了之后,JaegerMonkey、IonMonkey 等 JIT 便登场,来编译生成高效的机器码。


总结一下:


JavaScript 代码会先被引擎编译,转化成能被解释器识别的字节码。



源码会被词法分析,语法分析,生成 AST 抽象语法树。



AST 抽象语法树又会被字节码生成器进行多次优化,最终生成了中间态的字节码。这时的字节码就可以被解释器执行了。


这样,JavaScript 代码就可以被引擎跑起来了。


JavaScript 在运行过程中涉及到的作用域有3种:


  1. 全局作用域(Global Scope)JavaScript 代码开始运行的默认环境

  2. 局部作用域(Local Scpoe)代码进入一个 JavaScript 函数

  3. Eval 作用域 使用 eval() 执行代码


当 JavaScript 代码执行的时候,引擎会创建不同的执行上下文,这些执行上下文就构成了一个执行上下文栈(Execution context stack,ECS)。


全局执行上下文永远都在栈底,当前正在执行的函数在栈顶。



当 JavaScript 引擎遇到一个函数执行的时候,就会创建一个执行上下文,并且压入执行上下文栈,当函数执行完毕的时候,就会将函数的执行上下文从栈中弹出。


对于每个执行上下文都有三个重要的属性,变量对象(Variable object,VO),作用域链(Scope chain)和this。这三个属性跟代码运行的行为有很重要的关系。


变量对象 VO 是与执行上下文相关的数据作用域。它是一个与上下文相关的特殊对象,其中存储了在上下文中定义的变量和函数声明。也就是说,一般 VO 中会包含以下信息:


  1. 创建 arguments object

  2. 查找函数声明(Function declaration)

  3. 查找变量声明(Variable declaration)



上图也解释了,为何函数提升优先级会在变量提升前面。


这里还会牵扯到活动对象(Activation object):


只有全局上下文的变量对象允许通过 VO 的属性名称间接访问。在函数执行上下文中,VO 是不能直接访问的,此时由活动对象(Activation Object, 缩写为AO)扮演 VO 的角色。活动对象是在进入函数上下文时刻被创建的,它通过函数的 arguments 属性初始化。



Arguments Objects 是函数上下文里的激活对象 AO 中的内部对象,它包括下列属性:


  1. callee:指向当前函数的引用

  2. length: 真正传递的参数的个数

  3. properties-indexes:就是函数的参数值(按参数列表从左到右排列)


JavaScript 解释器创建执行上下文的时候,会经历两个阶段:


  • 创建阶段(当函数被调用,但是开始执行函数内部代码之前)

创建 Scope chain,创建 VO/AO(variables, functions and arguments),设置 this 的值。


  • 激活 / 代码执行阶段

设置变量的值,函数的引用,然后解释/执行代码。


VO 和 AO 的区别就在执行上下文的这两个生命周期里面。



VO 和 AO 的关系可以理解为,VO 在不同的 Execution Context 中会有不同的表现:当在 Global Execution Context 中,直接使用的 VO;但是,在函数 Execution Context 中,AO 就会被创建。


JavaScript 中的作用域链


在 JavaScript 中有两种变量传递的方式


1. 通过调用函数,执行上下文的栈传递变量。


函数每调用一次,就需要给它的参数和变量准备新的存储空间,就会创建一个新的环境将(变量和参数的)标识符合变量做映射。对于递归的情况,执行上下文,即通过环境的引用是在栈中进行管理的。这里的栈对应了调用栈。


JavaScript 引擎会以堆栈的方式来处理它们,这个堆栈,我们称其为函数调用栈(call stack)。栈底永远都是全局上下文,而栈顶就是当前正在执行的上下文。


这里举个例子:比如用递归的方式计算n的阶乘。


2. 作用域链


在 JavaScript 中有一个内部属性 [[ Scope ]] 来记录函数的作用域。在函数调用的时候,JavaScript 会为这个函数所在的新作用域创建一个环境,这个环境有一个外层域,它通过 [[ Scope ]] 创建并指向了外部作用域的环境。因此在 JavaScript 中存在一个作用域链,它以当前作用域为起点,连接了外部的作用域,每个作用域链最终会在全局环境里终结。全局作用域的外部作用域指向了null。


作用域链,是由当前环境与上层环境的一系列变量对象组成,它保证了当前执行环境对符合访问权限的变量和函数的有序访问。


作用域是一套规则,是在 JavaScript 引擎编译的时候确定的。

作用域链是在执行上下文的创建阶段创建的,这是在 JavaScript 引擎解释执行阶段确定的。


function myFunc( myParam ) {

var myVar = 123;

return myFloat;

}

var myFloat = 2.0;  // 1

myFunc('ab');       // 2


当程序运行到标志 1 的时候:



函数 myFunc 通过 [[ Scope]] 连接着它的作用域,全局作用域。


当程序运行到标志 2 的时候,JavaScript 会创建一个新的作用域用来管理参数和本地变量。



由于外层作用域链,使得 myFunC 可以访问到外层的 myFloat 。


这就是 Javascript 语言特有的"作用域链"结构(chain scope),子对象会一级一级地向上寻找所有父对象的变量。所以,父对象的所有变量,对子对象都是可见的,反之则不成立。


作用域链是保证对执行环境有权访问的所有变量和函数的有序访问。作用域链的前端始终是当前执行的代码所在环境的变量对象。而前面我们已经讲了变量对象的创建过程。作用域链的下一个变量对象来自包含环境即外部环境,这样,一直延续到全局执行环境;全局执行环境的变量对象始终都是作用域链中的最后一个对象。








请到「今天看啥」查看全文