2

为什么 Java 堆分配调整大小会导致 OOME?

我们在日志中看到 OutOfMemoryExceptions,它们似乎与 java 堆提交大小从 ~1G 增长到 ~2.4G 一致。尽管有错误消息,但似乎我们没有用完堆空间。除了抛出异常(并生成堆转储)之外,调整大小似乎最终成功并且应用程序继续运行而没有问题(大约 2.4G 堆提交大小)。

这是日志输出的示例:

INFO   | jvm 1    | 2013/08/16 12:08:05 | [GC [PSYoungGen: 328000K->2997K(339200K)] 645686K->320683K(1038272K), 0.0101580 secs] [Times: user=0.01 sys=0.00, real=0.00 secs] 
INFO   | jvm 1    | 2013/08/16 12:09:14 | [GC [PSYoungGen: 331509K->3487K(338816K)] 649195K->322153K(1037888K), 0.0115600 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:09:59 | [GC [PSYoungGen: 331999K->2928K(340032K)] 650665K->322608K(1039104K), 0.0099300 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:10:48 | [GC [PSYoungGen: 333104K->2723K(339648K)] 652784K->323240K(1038720K), 0.0100130 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:28 | [GC [PSYoungGen: 332885K->3884K(340864K)] 653402K->325089K(1039936K), 0.0106250 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:39 | [GC [PSYoungGen: 23694K->463K(340352K)] 344899K->323656K(2437504K), 0.0070330 secs] [Times: user=0.01 sys=0.00, real=0.00 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:39 | [GC [PSYoungGen: 463K->0K(340608K)] 323656K->323592K(2437760K), 0.0044440 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:39 | [Full GC
INFO   | jvm 1    | 2013/08/16 12:11:40 |  [PSYoungGen: 0K->0K(340608K)] [PSOldGen: 323592K->323592K(699072K)] 323592K->323592K(1039680K) [PSPermGen: 159297K->159297K(262144K)], 1.2076900 secs] [Times: user=1.20 sys=0.00, real=1.21 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:40 | [GC [PSYoungGen: 0K->0K(340736K)] 323592K->323592K(2437888K), 0.0046330 secs] [Times: user=0.02 sys=0.00, real=0.00 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:40 | [Full GC
INFO   | jvm 1    | 2013/08/16 12:11:42 |  [PSYoungGen: 0K->0K(340736K)] [PSOldGen: 323592K->279953K(744512K)] 323592K->279953K(1085248K) [PSPermGen: 159297K->159062K(262144K)], 1.7593100 secs] [Times: user=1.75 sys=0.00, real=1.76 secs] 
INFO   | jvm 1    | 2013/08/16 12:11:42 | java.lang.OutOfMemoryError: Java heap space
INFO   | jvm 1    | 2013/08/16 12:11:42 | Dumping heap to java_pid28908.hprof ...
INFO   | jvm 1    | 2013/08/16 12:11:48 | Heap dump file created [463314899 bytes in 6.037 secs]
INFO   | jvm 1    | 2013/08/16 12:12:36 | [GC [PSYoungGen: 331840K->6044K(352192K)] 611793K->285998K(2449344K), 0.0164060 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] 
INFO   | jvm 1    | 2013/08/16 12:13:28 | [GC [PSYoungGen: 352156K->6161K(364160K)] 632110K->286114K(2461312K), 0.0152330 secs] [Times: user=0.02 sys=0.01, real=0.01 secs] 
INFO   | jvm 1    | 2013/08/16 12:14:47 | [GC [PSYoungGen: 364113K->6575K(374144K)] 644066K->288169K(2471296K), 0.0179930 secs] [Times: user=0.02 sys=0.01, real=0.02 secs] 

请注意,在 OOME 之前,提交的总堆在 1GB 和 2.4GB 之间波动。我们可以看到它之前相当稳定在 1GB,之后相当稳定在 2.4GB。

此 1.6.0._24 JVM 的 javaopts 包括:

  • -Xmx3072m
  • -XX:+HeapDumpOnOutOfMemoryError
  • -XX:-UseGCOverheadLimit
  • -详细:gc
  • -Xss256k
  • -XX:MaxPermSize=256m
  • -服务器
  • -XX:+PrintGC详情

JVM 正在运行 1.6.0._24。我们现在无法更改版本,但在接下来的一两个月内会有一个窗口可以这样做。如果 1.6.0_45 更加稳定,我们将致力于切换到该版本。我们目前正在对其进行测试。

该机器只有 4GB 的总系统内存。此外,还使用了一个小型 RAM 磁盘。我担心 Xmx 设置对于这个环境来说已经太高了。

这让我们感到困惑,因为在异常发生时堆使用量似乎不是很大。为什么我们会得到这个 OOME?

更新:我们试图通过将初始内存 (Xms) 设置为等于最大内存 (Xmx) 来防止这种情况。到目前为止,尽管我们尚未在生产中引入变化,但这些实验一直很有希望。它仍然没有解释为什么首先会发生 OOME,尽管它似乎表明可以在不增加最大堆大小(或减少应用程序内存占用)的情况下避免 OOME。那么为什么堆大小调整会导致 OOME 仍然是个谜?

4

1 回答 1

1

为了阅读您的日志,您似乎有一个非常大的活动爆发,最喜欢大到足以直接进入终身/老一代的对象。我仍然建议您增加最大内存以查看应用程序的行为方式,因为 OOME 可能会给您带来令人困惑的统计数据。


这暗示了早期的大力推广。“GC”是一个次要集合,它似乎需要每个对象,触发一个完整的 GC,它会找到一些可以丢弃的终身对象。当年轻对象在 Eden 空间中死亡时,GC 效果最佳,但看起来您的大多数对象都在终身空间中死亡。

测试这一点的一种方法是使最大堆空间更大。如果您可以尝试 24 GB 堆或 80% 的主内存,请查看它的行为方式。例如-Xmx24g,如果您有 32 GB 的内存,请尝试。从这些数字来看,您似乎需要至少 5 GB 的 Eden 大小。

如果这不是一个选项,我建议您使用内存分析器将内存消耗减少至少 3 倍。

我会检查您是否有 Java 6 的最新版本,例如更新 45。更新 18 和 26 之间有显着的性能改进。

于 2013-08-15T15:20:48.517 回答