12

我正在为一个研究项目做准备。

说出一种难以优化的主流语言或语言特性,以及为什么该特性值得或不值得付出的代价,或者只是用轶事证据来揭穿我的理论。在有人将此标记为主观之前,我要求提供语言或功能的具体示例,以及优化这些功能的想法,或者我没有考虑过的重要功能。此外,任何对证明我的理论正确或错误的实现的引用。

在我的难以优化的特性和我的理论列表中名列前茅(我的一些理论未经测试,基于思想实验):

1)运行时方法重载(又名多方法分派或基于签名的分派)。与允许运行时重新编译或方法添加的功能结合使用时是否难以优化。还是只是很难,无论如何?调用站点缓存是许多运行时系统的常见优化,但多方法增加了额外的复杂性,并且使得内联方法不太实用。

2)类型变形/变体(也就是基于值的类型,而不是基于变量的类型)当您不知道某些类型是否可以在基本块中更改时,根本无法应用传统的优化。结合多方法,内联必须小心地完成,并且可能只针对给定的被调用者大小阈值。IE。很容易考虑内联简单的属性获取(getter / setter),但内联复杂的方法可能会导致代码膨胀。另一个问题是我不能只将变量分配给寄存器并将其 JIT 到本机指令,因为我必须携带类型信息,或者每个变量都需要 2 个寄存器而不是 1 个。在 IA-32 上这很不方便,即使使用 x64 的额外寄存器进行了改进。这可能是我最喜欢的动态语言特性,因为它从程序员的角度简化了很多事情。

3)头等舱延续- 有多种实现它们的方法,我在两种最常见的方法中都这样做了,一种是堆栈复制,另一种是实现运行时以使用连续传递样式、仙人掌堆栈、写时复制堆栈帧,和垃圾收集。一流的延续有资源管理问题,即。我们必须保存所有内容,以防继续继续,而且我不知道是否有任何语言支持留下“意图”的延续(即“我不会回到这里,所以你可以丢弃这个世界的副本” )。在线程模型和延续模型中编程后,我知道两者都可以完成同样的事情,但延续' 优雅给运行时带来了相当大的复杂性,并且还可能影响缓存效率(堆栈的位置随着使用延续和协同程序而改变更多)。另一个问题是它们只是不映射到硬件。优化延续就是针对不太常见的情况进行优化,正如我们所知,常见的情况应该很快,而不太常见的情况应该是正确的。

4)指针算术和屏蔽指针的能力(以整数存储等)必须把它扔进去,但实际上我可以很容易地没有它。

我的感觉是,许多高级特性,尤其是动态语言中的特性,并没有映射到硬件. 微处理器实现在芯片优化背后进行了数十亿美元的研究,但语言特性的选择可能会边缘化其中许多特性(如缓存、堆栈顶部到寄存器的别名、指令并行性、返回地址缓冲区、循环缓冲区和分支预测)。微特征的宏应用不一定像一些开发人员想的那样成功,在 VM 中实现多种语言最终会将本机操作映射到函数调用中(即,语言越动态,我们必须查找的次数越多/在运行时缓存,什么都不能假设,所以我们的指令组合比传统的由更高比例的非本地分支组成,静态编译的代码),我们唯一能真正做到 JIT 的就是对非动态类型的表达式求值以及对常量或立即类型的操作。我的直觉是字节码虚拟机和 JIT 内核可能并不总是因此而适用于某些语言。

我欢迎你的回答。

4

2 回答 2

5

一些评论:

  • 所有具有动态调度的语言,即使是基于单个对象,似乎也很难有效地实现。看看在 Self(或者最近的 JavaScript,使用 SpiderMonkey)的运行时优化方面所做的所有努力。

  • 不要忽视定界的延续。目前还没有定论,但它们比经典的无定界延续更容易优化。阅读 Gasbichler 和 Sperber 的论文。

于 2010-03-24T23:26:49.780 回答
1

我的直觉是字节码虚拟机和 JIT 内核可能并不总是因此而适用于某些语言。

IronPython 不是被编写来证明虚拟机的性能不如该语言的本地实现(Python)。然后当 IronPython 的作者发现 IronPython 在字节码 VM 上的动态语言表现得非常好时,他们感到相当震惊?

微软自己的 .Net 内部小组记录在案,他们认为 JITter 最终将胜过“普通”编译器/链接器(例如 C/C++)。

我认为陪审团仍然没有解决这个问题。无论哪种方式都很难称其为。选择最适合工作的语言...

于 2010-03-24T23:40:55.963 回答