5

Java 方法用于模拟慢速计算的基准测试:

static int slowItDown() {
    int result = 0;
    for (int i = 1; i <= 1000; i++) {
        result += i;
    }
    return result;
}

恕我直言,这是一个非常糟糕的主意,因为它的身体可以被return 500500. 这似乎永远不会发生1 ; 正如 Jon Skeet 所说,可能是因为这种优化与真实代码无关。

有趣的是,一个稍微简单的方法result += 1;得到了完全优化(caliper 报告 0.460543 ns)。

但是即使我们同意优化返回常量结果的方法对实际代码没有用处,仍然存在循环展开,这可能导致类似

static int slowItDown() {
    int result = 0;
    for (int i = 1; i <= 1000; i += 2) {
        result += 2 * i + 1;
    }
    return result;
}

所以我的问题仍然存在:为什么这里没有进行优化?

1与我最初写的相反;我一定看到了什么不存在的东西。

4

1 回答 1

3

好吧,JVM确实优化掉了这样的代码。问题是在以这种方式分析之前,它必须被检测为真正的热点多少次(基准通常比这种单一方法做得更多)。在我的设置中,它需要 16830 次调用才能使执行时间(几乎)为零。

这样的代码不会出现在真实的代码中是正确的。然而,在其他热点的几次内联操作之后,它可能仍然存在,处理的值不是编译时常量,而是运行时常量或事实上的常量(理论上可能会改变但实际上不会改变的值)。当这样一段代码仍然存在时,完全优化它是一个很大的好处,但预计不会很快发生,即直接从 main 方法调用时。

更新:我简化了代码,优化来得更早。

public static void main(String[] args) {
  final int inner=10;
  final float innerFrac=1f/inner;
  int count=0; 
  for(int j=0; j<Integer.MAX_VALUE; j++) {
    long t0=System.nanoTime();
    for(int i=0; i<inner; i++) slowItDown();
    long t1=System.nanoTime();
    count+=inner;
    final float dt = (t1-t0)*innerFrac;
    System.out.printf("execution time: %.0f ns%n", dt);
    if(dt<10) break;
  }
  System.out.println("after "+count+" invocations");
  System.out.println(System.getProperty("java.version"));
  System.out.println(System.getProperty("java.vm.version"));
}
static int slowItDown() {
  int result = 0;
  for (int i = 1; i <= 1000; i++) {
      result += i;
  }
  return result;
}

…</p>

execution time: 0 ns
after 15300 invocations
1.7.0_13
23.7-b01

(64 位服务器虚拟机)

于 2013-09-09T14:00:26.777 回答