在 Solaris SPARC 机器上对一些 Java 代码进行基准测试时,我注意到我第一次调用基准测试函数时,它的运行速度非常慢(相差 10 倍):
- 第一 | 1 | 25295.979 毫秒
- 第二 | 1 | 2256.990 毫秒
- 第三| 1 | 2250.575 毫秒
为什么是这样?我怀疑 JIT 编译器,有没有办法验证这一点?
编辑:根据一些答案,我想澄清一下,这段代码是我能找到的表现这种行为的最简单的测试用例。所以我的目标不是让它快速运行,而是要了解发生了什么,这样我就可以在我的实际基准测试中避免它。
已解决: Tom Hawtin 正确地指出我的“慢”时间实际上是合理的。根据这一观察,我将调试器附加到 Java 进程。在第一个过程中,内部循环如下所示:
0xf9037218: cmp %l0, 100
0xf903721c: bge,pn %icc,0xf90371f4 ! 0xf90371f4
0xf9037220: nop
0xf9037224: ld [%l3 + 92], %l2
0xf9037228: ld [%l2 + 8], %l6
0xf903722c: add %l6, 1, %l5
0xf9037230: st %l5, [%l2 + 8]
0xf9037234: inc %l0
0xf9037238: ld [%l1], %g0
0xf903723c: ba,pt %icc,0xf9037218 ! 0xf9037218
在以下迭代中,循环如下所示:
0xf90377d4: sub %l2, %l0, %l3
0xf90377d8: add %l3, %l0, %l2
0xf90377dc: add %l2, 1, %l4
0xf90377e0: inc %l0
0xf90377e4: cmp %l0, 100
0xf90377e8: bl,pn %icc,0xf90377d8 ! 0xf90377d8
因此,HotSpot 从内部循环中移除了内存访问,将其加速了一个数量级。
教训:做数学!我应该自己做汤姆的计算。
基准 Java 代码:
private int counter;
private int nThreads;
private void measure(String tag) throws Exception {
MyThread threads[] = new MyThread[nThreads];
int i;
counter = 0;
for (i = 0; i < nThreads; i++)
threads[i] = new MyThread();
long start = System.nanoTime();
for (i = 0; i < nThreads; i++)
threads[i].start();
for (i = 0; i < nThreads; i++)
threads[i].join();
if (tag != null)
System.out.format("%-20s | %-2d | %.3f ms \n", tag, nThreads,
new Double((System.nanoTime() - start) / 1000000.0));
}
public MyBench() {
try {
this.nThreads = 1;
measure("First");
measure("Second");
measure("Third");
} catch (Exception e) {
System.out.println("Error: " + e);
}
}
private class MyThread extends Thread {
public void run() {
while (counter < 10000000) {
// work
for (int j = 0; j < 100; j++)
counter++;
counter -= 99;
}
}
}