08 | 作用域和生存期：实现块作用域和函数

Aug 30, 2019

08 | 作用域和生存期：实现块作用域和函数-极客时间



下载APP





关闭

讲堂部落提薪训练营云原生训练营架构实战营企业版极客商城兑换中心 App下载浏览器插件

渠道合作

推荐作者

08 | 作用域和生存期：实现块作用域和函数

2019-08-30 宫文学来自北京

《编译原理之美》

课程介绍



讲述：宫文学

时长13:37大小12.46M



目前，我们已经用 Antlr 重构了脚本解释器，有了工具的帮助，我们可以实现更高级的功能，比如函数功能、面向对象功能。当然了，在这个过程中，我们还要克服一些挑战，比如：
如果要实现函数功能，要升级变量管理机制；
引入作用域机制，来保证变量的引用指向正确的变量定义；
提升变量存储机制，不能只把变量和它的值简单地扔到一个 HashMap 里，要管理它的生存期，减少对内存的占用。
本节课，我将借实现块作用域和函数功能，带你探讨作用域和生存期及其实现机制，并升级变量管理机制。那么什么是作用域和生存期，它们的重要性又体现在哪儿呢？
“作用域”和“生存期”是计算机语言中更加基础的概念，它们可以帮你深入地理解函数、块、闭包、面向对象、静态成员、本地变量和全局变量等概念。
而且一旦你深入理解，了解作用域与生存期在编译期和运行期的机制之后，就能解决在学习过程中可能遇到的一些问题，比如：
闭包的机理到底是什么？
为什么需要栈和堆两种机制来管理内存？它们的区别又是什么？
一个静态的内部类和普通的内部类有什么区别？
了解上面这些内容之后，接下来，我们来具体看看什么是作用域。
作用域（Scope）作用域是指计算机语言中变量、函数、类等起作用的范围，我们来看一个具体的例子。
下面这段代码是用 C 语言写的，我们在全局以及函数 fun 中分别声明了 a 和 b 两个变量，然后在代码里对这些变量做了赋值操作：
/*
scope.c
测试作用域。
 */
#include <stdio.h>
int a = 1;
void fun()
{
    a = 2;
    //b = 3;   //出错，不知道b是谁
    int a = 3; //允许声明一个同名的变量吗？
    int b = a; //这里的a是哪个？
    printf("in fun: a=%d b=%d \n", a, b);
}
int b = 4; //b的作用域从这里开始
int main(int argc, char **argv){
    printf("main--1: a=%d b=%d \n", a, b);
    fun();
    printf("main--2: a=%d b=%d \n", a, b);
    //用本地变量覆盖全局变量
    int a = 5;
    int b = 5;
    printf("main--3: a=%d b=%d \n", a, b);
    //测试块作用域
    if (a > 0){
        int b = 3; //允许在块里覆盖外面的变量
        printf("main--4: a=%d b=%d \n", a, b);
    }
    else{
        int b = 4; //跟if块里的b是两个不同的变量
        printf("main--5: a=%d b=%d \n", a, b);
    }
    printf("main--6: a=%d b=%d \n", a, b);
}
这段代码编译后运行，结果是：
main--1: a=1 b=4 
in fun: a=3 b=3 
main--2: a=2 b=4 
main--3: a=5 b=5 
main--4: a=5 b=3 
main--6: a=5 b=5 
我们可以得出这样的规律：
变量的作用域有大有小，外部变量在函数内可以访问，而函数中的本地变量，只有本地才可以访问。
变量的作用域，从声明以后开始。
在函数里，我们可以声明跟外部变量相同名称的变量，这个时候就覆盖了外部变量。
下面这张图直观地显示了示例代码中各个变量的作用域：
另外，C 语言里还有块作用域的概念，就是用花括号包围的语句，if 和 else 后面就跟着这样的语句块。块作用域的特征跟函数作用域的特征相似，都可以访问外部变量，也可以用本地变量覆盖掉外部变量。
你可能会问：“其他语言也有块作用域吗？特征是一样的吗？”其实，各个语言在这方面的设计机制是不同的。比如，下面这段用 Java 写的代码里，我们用了一个 if 语句块，并且在 if 部分、else 部分和外部分别声明了一个变量 c：
/**
 * Scope.java
 * 测试Java的作用域
 */
public class ScopeTest{
    public static void main(String args[]){
        int a = 1;
        int b = 2;
        if (a > 0){
            //int b = 3; //不允许声明与外部变量同名的变量
            int c = 3;
        }
        else{
            int c = 4;   //允许声明另一个c，各有各的作用域
        }
        
        int c = 5;  //这里也可以声明一个新的c
    }
}
你能看到，Java 的块作用域跟 C 语言的块作用域是不同的，它不允许块作用域里的变量覆盖外部变量。那么和 C、Java 写起来很像的 JavaScript 呢？来看一看下面这段测试 JavaScript 作用域的代码：
/**
 * Scope.js
 * 测试JavaScript的作用域
 */
var a = 5;
var b = 5;
console.log("1: a=%d b=%d", a, b);
if (a > 0) {
    a = 4;
    console.log("2: a=%d b=%d", a, b);
    var b = 3; //看似声明了一个新变量，其实还是引用的外部变量
    console.log("3: a=%d b=%d", a, b);
}
else {
    var b = 4;
    console.log("4: a=%d b=%d", a, b);
}
console.log("5: a=%d b=%d", a, b);
for (var b = 0; b< 2; b++){  //这里是否能声明一个新变量，用于for循环？
    console.log("6-%d: a=%d b=%d",b, a, b);
}
console.log("7: a=%d b=%d", a, b);
这段代码编译后运行，结果是：
1: a=5 b=5
2: a=4 b=5
3: a=4 b=3
5: a=4 b=3
6-0: a=4 b=0
6-1: a=4 b=1
7: a=4 b=2
你可以看到，JavaScript 是没有块作用域的。我们在块里和 for 语句试图重新定义变量 b，语法上是允许的，但我们每次用到的其实是同一个变量。
对比了三种语言的作用域特征之后，你是否发现原来看上去差不多的语法，内部机理却不同？这种不同其实是语义差别的一个例子。你要注意的是，现在我们讲的很多内容都已经属于语义的范畴了，对作用域的分析就是语义分析的任务之一。
生存期（Extent）了解了什么是作用域之后，我们再理解一下跟它紧密相关的生存期。它是变量可以访问的时间段，也就是从分配内存给它，到收回它的内存之间的时间。
在前面几个示例程序中，变量的生存期跟作用域是一致的。出了作用域，生存期也就结束了，变量所占用的内存也就被释放了。这是本地变量的标准特征，这些本地变量是用栈来管理的。
但也有一些情况，变量的生存期跟语法上的作用域不一致，比如在堆中申请的内存，退出作用域以后仍然会存在。
下面这段 C 语言的示例代码中，fun 函数返回了一个整数的指针。出了函数以后，本地变量 b 就消失了，这个指针所占用的内存（&b）就收回了，其中 &b 是取 b 的地址，这个地址是指向栈里的一小块空间，因为 b 是栈里申请的。在这个栈里的小空间里保存了一个地址，指向在堆里申请的内存。这块内存，也就是用来实际保存数值 2 的空间，并没有被收回，我们必须手动使用 free() 函数来收回。
/*
extent.c
测试生存期。
 */
#include <stdio.h>
#include <stdlib.h>
int * fun(){
    int * b = (int*)malloc(1*sizeof(int)); //在堆中申请内存
    *b = 2;  //给该地址赋值2
   
    return b;
}
int main(int argc, char **argv){
    int * p = fun();
    *p = 3;
    printf("after called fun: b=%lu *b=%d \n", (unsigned long)p, *p);
 
    free(p);
}
类似的情况在 Java 里也有。Java 的对象实例缺省情况下是在堆中生成的。下面的示例代码中，从一个方法中返回了对象的引用，我们可以基于这个引用继续修改对象的内容，这证明这个对象的内存并没有被释放：
/**
 * Extent2.java
 * 测试Java的生存期特性
 */
public class Extent2{
 
    StringBuffer myMethod(){
        StringBuffer b = new StringBuffer(); //在堆中生成对象实例
        b.append("Hello ");
        System.out.println(System.identityHashCode(b)); //打印内存地址
        return b;  //返回对象引用，本质是一个内存地址
    }
    public static void main(String args[]){
        Extent2 extent2 = new Extent2();
        StringBuffer c = extent2.myMethod(); //获得对象引用
        System.out.println(c);
        c.append("World!");         //修改内存中的内容
        System.out.println(c);
        //跟在myMethod()中打印的值相同
        System.out.println(System.identityHashCode(c));
    }
}
因为 Java 对象所采用的内存超出了申请内存时所在的作用域，所以也就没有办法自动收回。所以 Java 采用的是自动内存管理机制，也就是垃圾回收技术。
那么为什么说作用域和生存期是计算机语言更加基础的概念呢？其实是因为它们对应到了运行时的内存管理的基本机制。虽然各门语言设计上的特性是不同的，但在运行期的机制都很相似，比如都会用到栈和堆来做内存管理。
好了，理解了作用域和生存期的原理之后，我们就来实现一下，先来设计一下作用域机制，然后再模拟实现一个栈。
实现作用域和栈在之前的 PlayScript 脚本的实现中，处理变量赋值的时候，我们简单地把变量存在一个哈希表里，用变量名去引用，就像下面这样：
public class SimpleScript {
    private HashMap<String, Integer> variables = new HashMap<String, Integer>();
    ...
}
但如果变量存在多个作用域，这样做就不行了。这时，我们就要设计一个数据结构，区分不同变量的作用域。分析前面的代码，你可以看到作用域是一个树状的结构，比如 Scope.c 的作用域：
面向对象的语言不太相同，它不是一棵树，是一片树林，每个类对应一棵树，所以它也没有全局变量。在我们的 playscript 语言中，我们设计了下面的对象结构来表示 Scope：
//编译过程中产生的变量、函数、类、块，都被称作符号
public abstract class Symbol {
    //符号的名称
    protected String name = null;
    //所属作用域
    protected Scope enclosingScope = null;
    //可见性，比如public还是private
    protected int visibility = 0;
    //Symbol关联的AST节点
    protected ParserRuleContext ctx = null;
}
//作用域
public abstract class Scope extends Symbol{
    // 该Scope中的成员，包括变量、方法、类等。
    protected List<Symbol> symbols = new LinkedList<Symbol>();
}
//块作用域
public class BlockScope extends Scope{
    ...
}
//函数作用域
public class Function extends Scope implements FunctionType{
    ...  
}
//类作用域
public class Class extends Scope implements Type{
    ...
}
目前我们划分了三种作用域，分别是块作用域（Block）、函数作用域（Function）和类作用域（Class）。
我们在解释执行 playscript 的 AST 的时候，需要建立起作用域的树结构，对作用域的分析过程是语义分析的一部分。也就是说，并不是有了 AST，我们马上就可以运行它，在运行之前，我们还要做语义分析，比如对作用域做分析，让每个变量都能做正确的引用，这样才能正确地执行这个程序。
解决了作用域的问题以后，再来看看如何解决生存期的问题。还是看 Scope.c 的代码，随着代码的执行，各个变量的生存期表现如下：
进入程序，全局变量逐一生效；
进入 main 函数，main 函数里的变量顺序生效；
进入 fun 函数，fun 函数里的变量顺序生效；
退出 fun 函数，fun 函数里的变量失效；
进入 if 语句块，if 语句块里的变量顺序生效；
退出 if 语句块，if 语句块里的变量失效；
退出 main 函数，main 函数里的变量失效；
退出程序，全局变量失效。
通过下面这张图，你能直观地看到运行过程中栈的变化：
代码执行时进入和退出一个个作用域的过程，可以用栈来实现。每进入一个作用域，就往栈里压入一个数据结构，这个数据结构叫做栈桢（Stack Frame）。栈桢能够保存当前作用域的所有本地变量的值，当退出这个作用域的时候，这个栈桢就被弹出，里面的变量也就失效了。
你可以看到，栈的机制能够有效地使用内存，变量超出作用域的时候，就没有用了，就可以从内存中丢弃。我在 ASTEvaluator.java 中，用下面的数据结构来表示栈和栈桢，其中的 PlayObject 通过一个 HashMap 来保存各个变量的值：
private Stack<StackFrame> stack = new Stack<StackFrame>();
public class StackFrame {
    //该frame所对应的scope
    Scope scope = null;
    //enclosingScope所对应的frame
    StackFrame parentFrame = null;
    //实际存放变量的地方
    PlayObject object = null;
}
public class PlayObject {
    //成员变量
    protected Map<Variable, Object> fields = new HashMap<Variable, Object>();
}
目前，我们只是在概念上模仿栈桢，当我们用 Java 语言实现的时候，PlayObject 对象是存放在堆里的，Java 的所有对象都是存放在堆里的，只有基础数据类型，比如 int 和对象引用是放在栈里的。虽然只是模仿，这不妨碍我们建立栈桢的概念，在后端技术部分，我们会实现真正意义上的栈桢。
要注意的是，栈的结构和 Scope 的树状结构是不一致的。也就是说，栈里的上一级栈桢，不一定是 Scope 的父节点。要访问上一级 Scope 中的变量数据，要顺着栈桢的 parentFrame 去找。我在上图中展现了这种情况，在调用 fun 函数的时候，栈里一共有三个栈桢：全局栈桢、main() 函数栈桢和 fun() 函数栈桢，其中 main() 函数栈桢的 parentFrame 和 fun() 函数栈桢的 parentFrame 都是全局栈桢。
实现块作用域目前，我们已经做好了作用域和栈，在这之后，就能实现很多功能了，比如让 if 语句和 for 循环语句使用块作用域和本地变量。以 for 语句为例，visit 方法里首先为它生成一个栈桢，并加入到栈中，运行完毕之后，再从栈里弹出：
BlockScope scope = (BlockScope) cr.node2Scope.get(ctx);  //获得Scope
StackFrame frame = new StackFrame(scope);  //创建一个栈桢
pushStack(frame);    //加入栈中
...
//运行完毕，弹出栈
stack.pop();
当我们在代码中需要获取某个变量的值的时候，首先在当前桢中寻找。找不到的话，就到上一级作用域对应的桢中去找：
StackFrame f = stack.peek();       //获取栈顶的桢
PlayObject valueContainer = null;
while (f != null) {
    //看变量是否属于当前栈桢里
    if (f.scope.containsSymbol(variable)){ 
        valueContainer = f.object;
        break;
    }
    //从上一级scope对应的栈桢里去找  
    f = f.parentFrame;
}
运行下面的测试代码，你会看到在执行完 for 循环以后，我们仍然可以声明另一个变量 i，跟 for 循环中的 i 互不影响，这证明它们确实属于不同的作用域：
String script = "int age = 44; for(int i = 0;i<10;i++) { age = age + 2;} int i = 8;";
进一步的，我们可以实现对函数的支持。
实现函数功能先来看一下与函数有关的语法：
//函数声明
functionDeclaration
    : typeTypeOrVoid? IDENTIFIER formalParameters ('[' ']')*
      functionBody
    ;
//函数体
functionBody
    : block
    | ';'
    ;
//类型或void
typeTypeOrVoid
    : typeType
    | VOID
    ;
//函数所有参数
formalParameters
    : '(' formalParameterList? ')'
    ;
//参数列表
formalParameterList
    : formalParameter (',' formalParameter)* (',' lastFormalParameter)?
    | lastFormalParameter
    ;
//单个参数
formalParameter
    : variableModifier* typeType variableDeclaratorId
    ;
//可变参数数量情况下，最后一个参数
lastFormalParameter
    : variableModifier* typeType '...' variableDeclaratorId
    ;
//函数调用    
functionCall
    : IDENTIFIER '(' expressionList? ')'
    | THIS '(' expressionList? ')'
    | SUPER '(' expressionList? ')'
    ;
在函数里，我们还要考虑一个额外的因素：参数。在函数内部，参数变量跟普通的本地变量在使用时没什么不同，在运行期，它们也像本地变量一样，保存在栈桢里。
我们设计一个对象来代表函数的定义，它包括参数列表和返回值的类型：
public class Function extends Scope implements FunctionType{
    // 参数
    protected List<Variable> parameters = new LinkedList<Variable>();
    //返回值
    protected Type returnType = null;
    
    ...
}
在调用函数时，我们实际上做了三步工作：
建立一个栈桢；
计算所有参数的值，并放入栈桢；
执行函数声明中的函数体。
我把相关代码放在了下面，你可以看一下：
//函数声明的AST节点
FunctionDeclarationContext functionCode = (FunctionDeclarationContext) function.ctx;
//创建栈桢
functionObject = new FunctionObject(function);
StackFrame functionFrame = new StackFrame(functionObject);
// 计算实参的值
List<Object> paramValues = new LinkedList<Object>();
if (ctx.expressionList() != null) {
    for (ExpressionContext exp : ctx.expressionList().expression()) {
        Object value = visitExpression(exp);
        if (value instanceof LValue) {
            value = ((LValue) value).getValue();
        }
        paramValues.add(value);
    }
}
//根据形参的名称，在栈桢中添加变量
if (functionCode.formalParameters().formalParameterList() != null) {
    for (int i = 0; i < functionCode.formalParameters().formalParameterList().formalParameter().size(); i++) {
        FormalParameterContext param = functionCode.formalParameters().formalParameterList().formalParameter(i);
        LValue lValue = (LValue) visitVariableDeclaratorId(param.variableDeclaratorId());
        lValue.setValue(paramValues.get(i));
    }
}
// 调用方法体
rtn = visitFunctionDeclaration(functionCode);
// 运行完毕，弹出栈
stack.pop();
你可以用 playscript 测试一下函数执行的效果，看看参数传递和作用域的效果：
String script = "int b= 10; int myfunc(int a) {return a+b+3;} myfunc(2);";
课程小结本节课，我带你实现了块作用域和函数，还跟你一起探究了计算机语言的两个底层概念：作用域和生存期。你要知道：
对作用域的分析是语义分析的一项工作。Antlr 能够完成很多词法分析和语法分析的工作，但语义分析工作需要我们自己做。
变量的生存期涉及运行期的内存管理，也引出了栈桢和堆的概念，我会在编译器后端技术时进一步阐述。
我建议你在学习新语言的时候，先了解它在作用域和生存期上的特点，然后像示例程序那样做几个例子，借此你会更快理解语言的设计思想。比如，为什么需要命名空间这个特性？全局变量可能带来什么问题？类的静态成员与普通成员有什么区别？等等。
下一讲，我们会尝试实现面向对象特性，看看面向对象语言在语义上是怎么设计的，以及在运行期有什么特点。
一课一思既然我强调了作用域和生存期的重要性，那么在你熟悉的语言中，有哪些特性是能用作用域和生存期的概念做更基础的解读呢？比如，面向对象的语言中，对象成员的作用域和生存期是怎样的？欢迎在留言区与大家一起交流。
最后，感谢你的阅读，如果这篇文章让你有所收获，也欢迎你将它分享给更多的朋友。
今天讲的功能照样能在 playscript-java 项目中找到示例代码，其中还有用 playscript 写的脚本，你可以多玩一玩。
playscript-java（项目目录）： 码云  GitHub
PlayScript.java（入口程序）：码云   GitHub
PlayScript.g4（语法规则）：码云   GitHub
ASTEvaluator.java（解释器）：码云   GitHub
BlockScope.play（演示块作用域）：码云   GitHub
function.play（演示基础函数功能）：码云   GitHub
lab/scope 目录（各种语言的作用域测试）：码云    GitHub

分享给需要的人，Ta购买本课程，你将得18元

生成海报并分享

赞 9

提建议

07 | 编译器前端工具（二）：用Antlr重构脚本语言

09 | 面向对象：实现数据和方法的封装

 写留言

精选留言(26)

聆听v风声
2020-06-07
示例代码建议每节课加个tag或分支之类的，现在后面的人来看，都是最终完全版的代码..
共 1 条评论
27
许童童
2019-08-30
变量的使用范围由作用域决定，作用域由词法规则决定，词法分析生成作用域链，之后查找变量就沿着这条作用域链查找，与函数调用栈就没有关系了。一般函数的生存期就是出栈后就结束了，如果是引用对象会在本次GC中回收，如果产生了闭包，那就要等到引用闭包的变量销毁，生存期才结束。
作者回复: 很准确，很清晰！
26
幻境之桥
2020-04-01
我在上图中展现了这种情况，在调用 fun 函数的时候，栈里一共有三个栈桢：全局栈桢、main() 函数栈桢和 fun() 函数栈桢，其中 main() 函数栈桢的 parentFrame 和 fun() 函数栈桢的 parentFrame 都是全局栈桢。老师这里没有明白为什么 fun()函数栈桢的 parentFrame 是全局栈桢而不是 main()的函数栈桢这个 parentFrame 怎么定义呢？
展开
作者回复: 因为fun函数和main函数都是在全局作用域中定义的。fun中如果有一个变量，不是在本地声明的，那到哪里去找呢？要到全局作用域中去找，而不是到main函数中找。我在课程里没有介绍一个概念：词法作用域（Lexical Scope），等以后找机会加上。词法作用域又叫做静态作用域，也就是说，程序里用到的变量，在编译时，就知道是哪个变量定义。因为完全是根据声明时的位置关系来做变量引用解析的。
共 5 条评论
14
Johnson
2019-08-30
现在课程的做法相当于AST之后直接解析执行了，所有的逻辑都堆在AST和紧接着的语义分析，没有把AST转化成IR，然后在这个IR上做各种事情，最后再到interpreter执行。是因为前期为了简单起见，所以先这么直观的来么？
作者回复: 因为目前是在讲前端，所以就先不引入IR。同时也是在告诉同学们，哪怕我们只拿到了AST，也已经能做很多事情了。 IR在后端部分会讲。我会给出一个自己设计的IR的例子，用IR重新实现部分功能。然后再去采用LLVM的IR。
10
吃瓜群众路人丙
2019-09-22
也就是说，栈里的上一级栈桢，不一定是 Scope 的父节点。老师能举个反例吗
作者回复: 递归函数的调用。 int a; int foo(){ a = a+1; if (a<10){ return foo(); } else{ return a; } } 在递归调用的时候，你在函数里仍然可以访问全局变量。这个全局变量不在上一级的函数栈桢里。而是在最底下那个全局变量的栈桢。
7
mcuking
2019-09-07
其实 js 的 es6 版本已经支持块级作用域，可以用 let const 声明
作者回复: 是的，我注意到了。严格的表述这样写可能比较好：如果只是像java和c那样声明变量，就没有块作用域:-)
共 2 条评论
6
ZYS
2019-08-31
宫老师，可否兼顾一下用c++的学员，介绍一下cpp版本playscript如何在visual studio2010或更高的版本运行？
作者回复: 讲后端部分的时候，主要是用cpp版本实现的。那部分的指导资料我整理一下，写一个README.md，尽快更新到Github和码云上。先简单说一下： 1.如果仅仅用cpp版本的Antlr，这个比较简单，你做练习的时候可以试用一下。 2.把Antlr和LLVM一起用的时候，要配置的东西更多一些，好在有cmake。
3
Geek_f9ea2d
2019-09-11
functionDeclaration : typeTypeOrVoid? IDENTIFIER formalParameters ('[' ']')* (THROWS qualifiedNameList)? functionBody 中的('[' ']')* 这个没明白什么意思，函数的声明，我觉得这样就够了：typeTypeOrVoid? IDENTIFIER formalParameters
展开
作者回复: 这是直接照搬的Java的语法。这是对数组的支持。目前playscript并没有支持数组，但语法也就先这么放着了。
共 2 条评论
3
Aaaaaaaaaaayou
2020-02-05
老师，playscript-java/src/main/play/DefaultFunctionType.java 中 public static boolean isType(FunctionType type1, FunctionType type2) 函数中 List<Type> paramTypes2 = type1.getParamTypes(); 是不是写错了? type1 应该改为 type2
作者回复: 是的。谢谢你细心的阅读代码。我已经在github里更新了，并且在commit comment中专门感谢了你:)
2
北冥Master
2019-08-30
牛逼，越来越深入了，看的有点吃力了
作者回复: 后几讲涉及的都是语义功能，并涉及了一部分运行期技术（给后端技术部分提前做铺垫）。语义上的差别是每种语言真正的差别，但底层有一些共通的机制。搞搞明白对我们学各种语言都有好处。
2
Geek_6304e3
2022-02-11
老师，这个java项目的怎么跑起来呢，不懂java。
2
Geek_6304e3
2022-02-11
老师可以照顾下前端的同学吗？有没有JavaScript版的呢
2
草戊
2019-12-22
//全局变量 int i = 0; { //这里引用的是全局变量 i = 2; println(i); //输出：2 //允许在块里新创建一个同名的变量 int i = 3; println(i); //输出：3 } 您好，上面例子中【i = 2;】这句话在块中使用全局变量，但是实际上此块中也定义了i变量，只不过位置比较靠后，这种情况，本文中的作用域有办法解决吗？如果优先在本块中查找，那么会不会找到自己块中的i，而不是全局的i呢？
展开
作者回复: 实际上，在每一行代码，可以见到的“可用表达式”的集合都是不一样的。也就是说，在每一行，你可以反问的变量都是不同的。比如，在int i = 3之后，你访问的i，和在它前面访问的i，是不一样的。也就是说，块作用域，并不是在整个块里可见，而是在这个块里变量声明之后才可见。在28讲，数据流分析中，专门有活跃性分析的一个算法，会教会你确定在每个位置的可用变量。
1
Geek_89bbab
2019-09-01
private void pushStack(StackFrame frame) { // 如果新加入的frame是当前frame的下一级，则入栈 if (stack.size() > 0) { for (int i = stack.size()-1; i>0; i--){ StackFrame f = stack.get(i); if (f.scope.enclosingScope == frame.scope.enclosingScope){ frame.parentFrame = f.parentFrame; break; } else if (f.scope == frame.scope.enclosingScope){ frame.parentFrame = f; break; } else if (frame.object instanceof FunctionObject){ FunctionObject functionObject = (FunctionObject)frame.object; if (functionObject.receiver != null && functionObject.receiver.enclosingScope == f.scope) { frame.parentFrame = f; break; } } } if (frame.parentFrame == null){ frame.parentFrame = stack.peek(); } } stack.push(frame); if (traceStackFrame){ dumpStackFrame(); } } 老师可以解释一下这个函数吗?
展开
作者回复: 我往代码里加了注释，你可以更新一下看看！我也把注释拷贝到这里。里面有些特性，比如一等公民函数，是还没讲到的，10讲就会讲。第一个if： /* 如果新加入的栈桢，跟某个已有的栈桢的enclosingScope是一样的，那么这俩的parentFrame也一样。因为它们原本就是同一级的嘛。比如： void foo(){}; void bar(foo()); 或者： void foo(); if (...){ foo(); } */ 第二个if: /* 如果新加入的栈桢，是某个已有的栈桢的下一级，那么就把把这个父子关系建立起来。比如： void foo(){ if (...){ //把这个块往栈桢里加的时候，就符合这个条件。 } } 再比如,下面的例子: class MyClass{ void foo(); } MyClass c = MyClass(); //先加Class的栈桢，里面有类的属性，包括父类的 c.foo(); //再加foo()的栈桢 */ 第3个if： /* 这是针对函数可能是一等公民的情况。这个时候，函数运行时的作用域，与声明时的作用域会不一致。我在这里设计了一个“receiver”的机制，意思是这个函数是被哪个变量接收了。要按照这个receiver的作用域来判断。 */
共 2 条评论
1
hYector
2021-10-09
请教老师，既然说每个变量都有自己的作用域，但是在作用域实现部分，突然变成全局，main(), if块等作用域，这是观念是怎么切换过来的？
pencilCool
2021-07-09
嵌套的两个大括号，内外层出现同名变量：C 语言允许覆盖，java 不允许，javascript 指向同一个。
Geek_satsuki
2020-08-07
String script = "int b= 10; int myfunc(int a) {return a+b+3;} myfunc(2);"; 测试函数出现NULLException script = int b= 10; int myfunc(int a) {return a+b+3;} myfunc(2); Exception in thread "main" java.lang.NullPointerException at play.TypeResolver.exitFormalParameter(TypeResolver.java:105) at play.PlayScriptParser$FormalParameterContext.exitRule(PlayScriptParser.java:940)
展开
漏网之渔
2020-03-28
老师，lValue.setValue(paramValues.get(i)); 为什么执行完这一行，实参的值就能进入functionFrame了？调试了一下代码，发现进入了MyLVaue类的setValue方法，这个MyLvalue类有一个private PlayObject valueContainer属性，改变了这个属性中的Map<Variable, Object> fields值，但是它是怎么改变frame栈帧里的值的呢？这一点我调试了之后不太明白；对MyLvalue和frame的关系不太理解，请老师指点。
作者回复: 在示例程序中，我是用一个PlayObject来模拟栈帧的，它里面用了一个HashMap来存放变量值。这些变量可能是一个函数的本地变量，也可能是对象的成员变量。而MyLValue，实际上就是对一个栈帧中的变量的引用，相当于C语言中的一个变量地址。基于这个引用，就可以找到准确的变量存储位置，并做修改。
共 2 条评论
漏网之渔
2020-03-27
老师，这里的LValue和PlayObject分别扮演的角色功能是什么样的，什么时候会用到他们；看了源代码，自己有点理不清楚。
作者回复: 在示例代码里，PlayObject我就是拿它模拟一个栈帧的，里面放着各个变量的值。 LValue是左值的意思，也就是可以出现在赋值符号的左边。它得是一个对象引用（或C语言中的地址），以便往里面写新的值。而赋值符号右边的，叫做右值，它可以是一个具体的数值。左值可以当做右值用，但右值不可以当成左值用。在给AST做语义分析的时候，可以分析出哪个标识符实际是个左值，这样的话，遍历AST时，要获得变量引用，而不是获得变量值。
E
2019-12-04
有可以生成语义分析器的工具吗
作者回复: 没有。但是antlr支持在语法规则里嵌入一些代码，在语法分析的过程中完成一些语义分析工作。

