我开始在使用 LLVM 作为后端的语言中添加闭包(lambdas)。我已经为简单的情况实现了它们,它们总是可以内联,即不需要生成闭包定义本身的代码,因为它在使用的地方被内联。
但是如果闭包并不总是内联(例如,它被传递给另一个没有内联的函数),如何为闭包生成代码。最好,调用站点不应该关心它们是否传递了常规函数或闭包,而是将它们作为正常函数调用。
我可以生成一个具有合成名称的函数,但它必须将引用环境作为一个额外的参数,并且该函数不能只传递给另一个不知道所需额外参数的函数。
我已经想到了一种使用 LLVM 的蹦床内在函数的可能解决方案,它从函数中“删除”单个参数,返回一个指向蹦床函数的指针,该函数需要一个更少的参数。在这种情况下,如果为闭包生成的函数将引用环境作为第一个参数,我可以删除它并取回一个函数,该函数的参数与闭包实际声明的参数完全相同。这听起来可行吗?高效的?有没有更好的解决方案?
代码示例:
def applyFunctionTo(value: Int, f: (Int) -> Int) = f(value)
def main() = {
val m := 4;
val n := 5;
val lambda := { (x: Int) => x + m + n };
applyFunctionTo(3, lambda)
}
现在,让我们假设 this 不会被内联到def main() = 3 + 4 + 5
,并且applyFunctionTo
可能会单独编译,并且我们不能在那里更改调用站点。使用蹦床,我想生成的代码会是这样的(用伪代码表示,* 表示指针):
def main$lambda$1(env: {m: Int, n: Int}*, x: Int) = x + env.m + env.n
def main() = {
m = 4
n = 5
env* = allocate-space-for {Int, Int}
env = {m, n}
tramp* = create-trampoline-for(main$lambda$1*, env*)
return applyFunctionTo(3, tramp*)
// release memory for env and trampoline if the lambda didn't escape
}
这看起来对吗?