7

我有一段代码可以从队列中获取所有元素。之后我不关心队列的状态,我可以保证在我从中删除元素时不会修改队列。

我最初使用迭代器来提取元素,因为我认为它会比轮询元素更快......

但我进行了以下测试:

ConcurrentLinkedQueue<Object> queue = new ConcurrentLinkedQueue<>();
for (int i=0; i < 1000000; i++)
    queue.add(new Object());

LinkedList<Object> list = new LinkedList<>();
long start = System.currentTimeMillis();
for (Object object: queue)
    list.add(object);
long time1 = System.currentTimeMillis() - start;

list = new LinkedList<>(); 
start = System.currentTimeMillis();
Object object;
while ((object = queue.poll()) != null)
    list.add(object);
long time2 = System.currentTimeMillis() - start;

System.out.println(time1 + " " + time2);

我得到以下输出(平均超过 100 次运行)

1169 46

我的问题是:为什么轮询比迭代快?这对我来说完全不直观,因为 poll 将不得不修改队列并且迭代只需要查看状态。

编辑---格雷是对的

我循环运行它并得到输出(应该首先这样做)

1180 46
1422 25
287 32
14 26
226 26
236 25
12 26
14 25
13 25
13 26
13 25
268 25
13 25
14 176
13 26
13 26
13 25
13 25
13 26
13 24
13 26
13 25
...
4

1 回答 1

12

我的问题是:为什么轮询比迭代快?这对我来说完全不直观,因为 poll 将不得不修改队列并且迭代只需要查看状态。

正如@csoroiu 指出的那样,这似乎是一个热点编译器问题。鉴于 Java 的工作原理,在开始像这样的计时调用之前“预热”应用程序非常重要。

如果我在一个方法中运行你的测试 100 次,我最初看到由于 GC 开销和其他 JVM 魔法而导致的性能大不相同。但是,在添加一些.clear()方法和方法System.gc()末尾的 a 之后,性能数字与迭代器获胜更加一致:

108 143
89 152
83 148
78 140
79 153
90 155
...

有关更多详细信息,请参见 Peter 的答案:Java 中的 CPU 执行时间

有关如何正确进行这样的微基准测试的大量信息,请参阅这个详尽的答案:如何在 Java 中编写正确的微基准测试?

于 2013-09-20T18:14:31.480 回答