0

我们最近执行了从 Solaris SunOS 5.10 到 Redhat Linux VM 的服务器迁移。JVM 从 1.5.0_22 (32-bit) 升级到 1.6.0_06 (64-bit) 但是,从那以后,我们经常遇到 OutOfMemory 错误。我们研究过 64 位 JVM 需要多出 30 - 50% 的堆,因此我们将堆大小从 1200MB 增加到 2048MB 并试一试。但是,我们仍然观察到在服务器运行几个日期后发生了一些 OOME。

通过查看 GC 日志,我们发现在服务器启动几个日期后频繁发生 Full GC,并且每次 Full GC 只会释放少量内存,频繁的 Full GC 会降低应用程序的速度。

正如您可以看到 GC 日志的摘录,在 PSOldGen 中几乎没有释放内存

205023.895: [Full GC [PSYoungGen: 225919K->157256K(240960K)] [PSOldGen: 1841151K->1841151K(1841152K)] 2067071K->1998408K(2082112K) [PSPermGen: 108720K->108720K(109056K)], 6.2785770 secs] [Times: user=6.23 sys=0.01, real=6.28 secs] 
Heap after GC invocations=1638 (full 251):
 PSYoungGen      total 240960K, used 157256K [0x00002aab2e800000, 0x00002aab3e200000, 0x00002aab3e200000)
  eden space 225920K, 69% used [0x00002aab2e800000,0x00002aab38192208,0x00002aab3c4a0000)
  from space 15040K, 0% used [0x00002aab3d350000,0x00002aab3d350000,0x00002aab3e200000)
  to   space 15040K, 0% used [0x00002aab3c4a0000,0x00002aab3c4a0000,0x00002aab3d350000)
 PSOldGen        total 1841152K, used 1841151K [0x00002aaabe200000, 0x00002aab2e800000, 0x00002aab2e800000)
  object space 1841152K, 99% used [0x00002aaabe200000,0x00002aab2e7fffc8,0x00002aab2e800000)
 PSPermGen       total 109056K, used 108720K [0x00002aaaae200000, 0x00002aaab4c80000, 0x00002aaabe200000)
  object space 109056K, 99% used [0x00002aaaae200000,0x00002aaab4c2c3f8,0x00002aaab4c80000)
}  

这是单个 OC4J 实例在 24 小时内的堆使用模式,这对我来说很奇怪,它没有显示锯齿形路径,而是显示了一些随机模式。 在此处输入图像描述

我可以知道我能做什么吗?

服务器配置:

Red Hat Enterprise Linux Server release 5.7 (Tikanga) 2.6.18 274.el5 (64-bit)
CPU : 8, 16GB RAM
JVM version : Java(TM) SE Runtime Environment (build 1.6.0_06-b02)
Application server : OC4J 10.1.3.5

JVM 启动参数:

//Old confing
-server -Xms1200M -Xmx1200M -XX:MaxPermSize=64M -XX:+PrintHeapAtGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xnoclassgc -verbose:gc -XX:NewSize=250M -XX:MaxNewSize=250M -XX:SurvivorRatio=15 -Xconcurrentio -Xss128k

//New config
-server -Xms2048M -Xmx2048M -XX:MaxPermSize=256M -XX:+PrintHeapAtGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xnoclassgc -verbose:gc -XX:NewSize=250M -XX:MaxNewSize=250M -XX:SurvivorRatio=15 -Xconcurrentio -Xss128k
4

1 回答 1

0

这要么是应用程序中的内存泄漏,要么是 Java 内存管理中的错误。

自 1.6.0_06 版本以来,有一大堆关于内存管理和垃圾收集的错误修复,例如这两个:

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6676016 http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6824570

所以尝试以下方法:

  1. 升级到更新的 Java 1.6.0 版本。(如果不可能,您可以将 GC 策略设置从(例如)并行更改为并发,以查看是否绕过了潜在的 Java 错误。
  2. 使用 heapdump (jmap) 对应用程序的内存泄漏进行故障排除,以查看占用堆的内容。
于 2013-08-23T08:29:01.420 回答