我们有一个由 Jetty 运行的非常小的 Web 服务(少于 1K 行代码)。即使在我们的压力测试阶段,该服务也始终运行良好。但是,在运行 13 天后,我们在同一天在两个节点中遇到了 ClassNotFoundException。
奇怪的是,没有找到的类已经存在(它是启动例程的一部分,并且经常用于服务先前的请求)。实际上,只需重新启动该过程即可解决问题。两个节点都在不同的机器中,并且彼此独立。它们不依赖于外部资源,除了一个 JMS 连接。
我在谷歌搜索时找不到相关信息,因为大多数报告的问题与启动 Java 进程时类路径中缺少类有关,这不是我们的情况。我们怀疑可能存在以某种方式破坏 JVM 内存的内存泄漏,但这无法解释为什么相同的问题会同时在两个节点中发生。在过去的五天里,我们一直在运行密集的压力测试,附加了一个 JVM 监视器和一个内存泄漏分析器,一切似乎都很好。对于这个测试,我们将进程内存从 2GB 减少到 512MB。
细节:
- 使用 Java HotSpot(TM) 64 位服务器 VM(内部版本 16.3-b01,混合模式)
- 使用 jetty-runner-8.1.0.RC5.jar
- 原cmd行:java -Xmx2048M -jar jetty-runner-8.1.0.RC5.jar --port 5000 webapp.war
- 英特尔至强 E5-2680 8 核 (x2) + 16GB RAM
- 红帽企业 Linux 6
- 一些正在使用的框架:JBoss Resteasy、Spring IoC、Guava。
您能否就什么可能使 JVM 突然“忘记”先前加载的类的存在而无法再次加载它提供一些想法?
Caused by: java.lang.ClassNotFoundException: com.a.b.c.SomeClass
at java.net.URLClassLoader$1.run(URLClassLoader.java:202) ~[na:1.6.0_37]
at java.security.AccessController.doPrivileged(Native Method) ~[na:1.6.0_37]
at java.net.URLClassLoader.findClass(URLClassLoader.java:190) ~[na:1.6.0_37]
at java.lang.ClassLoader.loadClass(ClassLoader.java:306) ~[na:1.6.0_37]
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301) ~[na:1.6.0_37]
at java.lang.ClassLoader.loadClass(ClassLoader.java:247) ~[na:1.6.0_37]
at org.eclipse.jetty.webapp.WebAppClassLoader.loadClass(WebAppClassLoader.java:424) ~[na:na]
at org.eclipse.jetty.webapp.WebAppClassLoader.loadClass(WebAppClassLoader.java:377) ~[na:na]
at java.lang.Class.forName0(Native Method) ~[na:1.6.0_37]
at java.lang.Class.forName(Class.java:247) ~[na:1.6.0_37]
at sun.reflect.generics.factory.CoreReflectionFactory.makeNamedType(CoreReflectionFactory.java:95) ~[na:1.6.0_37]
at sun.reflect.generics.visitor.Reifier.visitClassTypeSignature(Reifier.java:107) ~[na:1.6.0_37]
at sun.reflect.generics.tree.ClassTypeSignature.accept(ClassTypeSignature.java:31) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseSig(AnnotationParser.java:370) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseClassValue(AnnotationParser.java:351) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseMemberValue(AnnotationParser.java:280) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseAnnotation(AnnotationParser.java:222) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseAnnotations2(AnnotationParser.java:69) ~[na:1.6.0_37]
at sun.reflect.annotation.AnnotationParser.parseAnnotations(AnnotationParser.java:52) ~[na:1.6.0_37]
at java.lang.reflect.Field.declaredAnnotations(Field.java:1014) ~[na:1.6.0_37]
at java.lang.reflect.Field.getDeclaredAnnotations(Field.java:1007) ~[na:1.6.0_37]
编辑:
有人提到我在 Win 下使用 NFS 挂载时,可能会发生 JVM 决定卸载一个类,然后在需要时重新加载它。如果在此过程中 NFS 连接中断,则文件句柄将无效,并且重新加载将失败并出现类似的堆栈跟踪。在我们的例子中,我们使用的是 Linux,所有涉及的文件都在同一个挂载中,这是一个本地硬盘。只是为了进行更多测试,我已经 CD 到 Jetty 临时目录并手动删除了一个众所周知的特定服务类。如果 JVM 卸载它然后尝试从 classes 目录重新加载它,它将失败。虽然这并不能解释最初的问题,但它可能会将更多信息放在桌面上......