6

向 Stack Overflow 上的所有编译器设计者致敬。

我目前正在从事一个项目,该项目专注于开发一种用于高性能计算的新脚本语言。源代码首先被编译成字节码表示。字节码然后由运行时加载,运行时对其执行积极的(并且可能是耗时的)优化(这比大多数“提前”编译器所做的更进一步,毕竟这是整个问题的重点项目)。请记住,此过程的结果仍然是字节码。

然后在虚拟机上运行字节码。目前,该虚拟机是使用直接跳转表和消息泵实现的。虚拟机使用指针遍历字节码,加载指针下的指令,在跳转表中查找指令处理程序并跳转到其中。指令处理程序执行适当的操作并最终将控制权返回给消息循环。虚拟机的指令指针递增,整个过程重新开始。我用这种方法所能达到的性能实际上是相当惊人的。当然,实际指令处理程序的代码再次手动微调。

现在大多数“专业”运行时环境(如 Java、.NET 等)都使用 Just-in-Time 编译在执行前将字节码转换为本机代码。使用 JIT 的 VM 通常比字节码解释器具有更好的性能。现在的问题是,由于解释器基本上所做的只是加载一条指令并在跳转表中查找跳转目标(请记住,指令处理程序本身是静态编译到解释器中的,所以它已经是本机代码),将使用即时编译会提高性能还是会降低性能?我真的无法想象解释器的跳转表会降低性能大量用于弥补使用 JITer 编译该代码所花费的时间。我知道 JITer 可以对代码执行额外的优化,但在我的例子中,非常激进的优化已经在执行之前在字节码级别执行。你认为我可以通过用 JIT 编译器替换解释器来获得更快的速度吗?如果是这样,为什么?

我知道同时实施方法和基准测试将为这个问题提供最准确的答案,但如果有明确的答案,可能不值得花时间。

谢谢。

4

3 回答 3

4

答案在于单字节码指令复杂度与跳转表开销的比率。如果您正在对大型矩阵乘法等高级操作进行建模,那么一点点开销将是微不足道的。如果你要增加一个整数,那当然会受到跳转表的显着影响。总体而言,平衡将取决于语言用于时间要求更高的任务的性质。如果它是一种通用语言,那么对于所有内容来说,开销最小会更有用,因为您不知道在紧密循环中将使用什么。为了快速量化潜在的改进,只需将一些嵌套循环进行一些简单的操作(但不能优化掉的操作)与等效的 C 或 C++ 程序进行比较。

于 2011-01-15T00:55:17.240 回答
2

当您使用解释器时,处理器中的代码缓存会缓存解释器代码;不是字节码(可能缓存在数据缓存中)。由于代码缓存比数据缓存快 2 到 3 倍,因此 IIRC;如果您进行 JIT 编译,您可能会看到性能提升。此外,您正在执行的本机真实代码可能是 PIC;JITted 代码可以避免的事情。

恕我直言,其他一切都取决于字节码的优化程度。

于 2011-03-08T17:05:34.500 回答
1

JIT 理论上可以更好地优化,因为它具有在编译时不可用的信息(尤其是关于典型的运行时行为)。因此,它可以例如进行更好的分支预测、根据需要推出循环等。

我确信您的跳转表方法是可以的,但我仍然认为与直接 C 代码相比,它的性能相当差,您不觉得吗?

于 2011-01-15T00:54:56.613 回答