Tag Archives: Continuation

Continuation

在 Ruby 1.8 中有一个内置类 Continuation,中文直翻是“延续”。这是计算机科学中一个比较底层的概念,它表示进程执行的某一特定时刻的计算过程的实例。通俗的讲,它就是 Ruby 中比 Binding 更加底层的一个能保存当前进程执行环境的物件,就好比游戏里,我们通过存档就能在环境改变之后重新读档,从档案记录的环境,记录的那一刻开始。“延续”一词,即是暗示了从记录的计算过程中的一个点继续执行之意。

Ruby 程序(CRuby 实现)的执行使用了相比于堆要更高效的栈结构来进行函数调用和局部变量的保存,而 Continuation 正是保存了进程运行在某一时刻时的栈内存状态,之后用户可以手动地去调用这个 Continuation 对象,让程序从这一个预先保存的记录点运行。这相当于不少语言中支持的 goto 语句跳转的一个超级版,因为 goto 只能进行局部跳转,而 Continuation 能上天入地,翻江倒海,一个筋斗十万八千里(实际上在 C 标准库中,Continuation 的功能是等同于 setjmp 和 longjmp 这两个函数所提供的功能的)。

有什么用?RM 有一个快捷键为 F12 的重置游戏的功能,当触发了这个命令时,RM 会让解释器从头开始重新执行脚本编辑器里的脚本,但并没有初始化符号表、GC 和堆结构。这使得原有的全局变量、常量、模块、类得以保存,但也可能会让我们与我们的老朋友——stack level too deep——再度重逢。由于脚本中大量使用 alias 别名方法,当 F12 按下后,没有进行判断的 alias 语句再次执行,就会导致两次同名一个方法后产生的经典 BUG(关于这个问题,这里不再赘述,论坛上已经有太多相关的帖子,请自行搜索 stack level too deep)。这个问题可以通过 method_defined? 等方法判断将要 alias 的方法是否已经定义来解决(alias 一次后方法就已定义了,第二次不会再定义),但并不是所有脚本编写者都有这个习惯。这里我们介绍一种使用 Continuation 的通用解法:

在 Main 脚本里的第一行插入一句:

callcc { |$__f12_no_reeval| }

这一句脚本让 RM 在执行到 Main 脚本时将一个保存了当前执行环境的 Continuation 对象赋给了 $__f12_no_reeval 这个全局变量;接着在脚本编辑器开头插入:

$__f12_no_reeval and $__f12_no_reeval.call

这句是先判断 $__f12_no_reeval 是否已初始化(即已经执行到 Main 脚本一次以上),如果是则调用这个 Continuation,让程序直接跳转到 Main 脚本开头的环境继续执行,避免了从开头到 Main 脚本之间的所有脚本的重新执行。由于产生冲突的、包含 alias 的脚本在这些脚本之中,保证只执行它们一次就从根本杜绝了这个问题的滋生。

在 Ruby 1.8 中,Continuation 的实现模型是与线程的实现模型一致的——线程调度器在进行绿色线程切换的时候,会进行类似 Continuation 的环境跳转。在 Ruby 1.9 中,由于 YARV 虚拟机采用的是本地线程,每个线程拥有自己的私有栈,他们之间就产生了区别。有趣的是,在 Ruby 1.9 中又引入了一个新的和 Continuation 类似的概念,那就是我们的 Fiber(纤程),一种轻量级的线程,它基本可以被看作是 Continuation 的替代品,同时由于效率比 Continuation 高(Continuation 保存栈内存状态的过程开销是巨大的),Ruby 社区就是否保留 Continuation 进行了激烈的辩论,就 1.9 而言,Continuation 仍然被作为标准库保留了下来。

绑定

  在计算机科学中,“绑定”(Binding)一词是指一个更复杂、更大型的物件的引用的创建。例如当我们编写了一个函数,这个函数名就绑定了该函数本体,我们可以通过函数名来引用并调用该函数,这被称为名称绑定;又如当 Ruby 通过 API 去调用了 C 语言写的库函数时,这就是一个语言绑定;再如面向对象语言中的方法调度 obj.method,这也是一个名称绑定,它会根据接收者 obj 具体的对象类型来确定应该引用哪个对象类型的 method 方法,而如果 obj 在编译时就能确定,那便可称之为静态绑定(早绑定),早期的静态类型语言(如 C)使用的是早绑定;如果 obj 在运行时才能确定,那便可称为动态绑定(迟绑定),动态类型语言(如 Ruby)使用的是迟绑定,而有些语言则同时支持早绑定和迟绑定,如 C++ 的虚函数使用迟绑定,普通函数则使用早绑定。

  在 Ruby 中,Kernel 有一个方法 binding,它返回一个 Binding 类型的对象。这个 Binding 对象就是我们这里说的绑定,它封装了当前执行上下文中的所有绑定(变量、方法、语句块、self 的名称绑定),而这些绑定直接决定了面向对象语言中的执行环境。比如,当我们调用 p 时,实际上是进行了 self 和 p 的绑定,而 p 具体是哪个方法,是由 self 的类型来决定的,如果我们在顶层,而 Kernel#p 又没有被重写,那 p 就是一个用来显示对象细节的方法。可以说有了一个绑定的列表,我们就有了一个完整的面向对象上下文的拷贝,就好比上帝在 12 分 37 秒复制了一份世界,而这个世界与原本世界的环境一模一样,既有这朵花,又有那株草。Ruby 的 Binding 对象的概念和 Continuation 有共通之处,但 Continuation 主要用于实际堆、栈内存的环境跳转,而 Binding 则比较高层。

  这个 Binding 对象有什么用?主要是用于 eval 这个函数。eval 的第一个参数是需要 eval 的一段脚本字符串,而第二个可选参数则接受一个 Binding 对象。当指定了 Binding 时,eval 会在传递给它的 Binding 所封装的执行环境里执行脚本,否则是在调用者的执行环境里执行。我们可以通过这个机制来进行一些不同上下文之间的通信,或者是在一个上下文即将被销毁之前保存该上下文环境以留他用,如:

def foo
  bar = 'baz'
  return binding
end

eval('p bar', foo)

  这里我们通过 foo 返回的 Binding 获取到了局部上下文销毁前的局部变量 bar 的值,而在不使用 binding 的情况下,局部变量 bar 在 foo 外层是不可见的。

  最后,Ruby 有一个预定义的常量:TOPLEVEL_BINDING,它指向一个封装了顶层绑定的对象,通过它我们可以在其它上下文中通过 eval 在顶层上下文环境中执行脚本。