我正在调查我的应用程序中偶尔发生的 JVM 崩溃。hs_err 文件包含有关崩溃的以下详细信息。
# SIGSEGV (0xb) at pc=0x065e68f4, pid=20208, tid=570166160
#
# Java VM: Java HotSpot(TM) Server VM (10.0-b23 mixed mode linux-x86)
...
# Problematic frame:
# V [libjvm.so+0x5e68f4]
...
Current thread (0x099ea800): JavaThread "Thread-315" daemon [_thread_in_vm, id=25782, stack(0x21fa3000,0x21fc1000)]
...
vm_info: Java HotSpot(TM) Server VM (10.0-b23) for linux-x86 JRE (1.6.0_07-b06), built on Jun 10 2008 01:20:15 by "java_re" with gcc 3.2.1-7a (J2SE release)
所以这告诉我 JVM 在运行一些 Java 代码时遇到了段错误。错误日志还包含有关崩溃线程堆栈的信息。
Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code)
V [libjvm.so+0x5e68f4]
V [libjvm.so+0x1c054f]
V [libjvm.so+0x1bfef2]
V [libjvm.so+0x1bf57f]
V [libjvm.so+0x592495]
V [libjvm.so+0x365c4e]
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
Java frames: (J=compiled Java code, j=interpreted, Vv=VM code)
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
v ~BufferBlob::Interpreter
J org.myapp.AppClass.getBytes()Lorg/myapp/ByteHolder;
我已经使用 GDB 从崩溃中连接到核心文件并获取有关堆栈的更多详细信息。这给了我以下输出。
#5 <signal handler called>
#6 0x065e68f4 in interpretedVFrame::monitors() const ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#7 0x061c054f in get_or_compute_monitor_info(JavaThread*) ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#8 0x061bfef2 in revoke_bias(oopDesc*, bool, bool, JavaThread*) ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#9 0x061bf57f in BiasedLocking::revoke_and_rebias(Handle, bool, Thread*) ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#10 0x06592495 in ObjectSynchronizer::fast_enter(Handle, BasicLock*, bool, Thread*) ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#11 0x06365c4e in InterpreterRuntime::monitorenter(JavaThread*, BasicObjectLock*) ()
from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
这表明原始错误报告中列出的六个 libjvm.so 帧与获取 Java 锁有关。但是,我在 org.myapp.AppClass.getBytes() 中找不到任何使用任何锁的代码。
堆栈中的 BufferBlob::Interpreter 行是什么意思?这些是 Java 堆栈帧吗?JVM堆栈帧?是否有可能计算出这些堆栈帧中被调用的内容?
注意:请不要建议我尝试切换到更新的 Hotspot JVM。我依赖 CMS 收集器,而最近的 V1.6 Hotspot JVM 都没有一个足够稳定的 CMS 收集器。
编辑:本文档 (http://www.oracle.com/technetwork/java/javase/tsg-vm-149989.pdf) 指出“v”帧是“VM 生成的存根帧”。知道这意味着什么吗?
EDIT2: org.myapp.AppClass.getBytes() 从 DataInputStream 读取。这可能涉及以下堆栈跟踪:
AppClass.getBytes()
AppClass.readByte()
DataInputStream.readByte()
SocketInputStream.read()
SocketInputStream.read(byte[],int,int)
PlainSocketImpl.aquireFD()
最后一个方法获取锁。这可能是最终调用上面列出的 JVM 代码的来源。上面的这个堆栈有一个简洁的特性,即在 getBytes() 下面有 5 个 Java 堆栈帧。这将与“Java 框架”列表中的 5 行 BufferBlob::Interpreter 完美匹配。
这提出了几个新问题:
- “Native frames”部分下的 BufferBlob::Interpreter 的 5 行是否可能只是“Java frames”部分下相同行的重复?
- 为什么错误日志不显示这 5 个堆栈帧的详细信息?
EDIT3 - 这个 Oracle 错误看起来可能是相同/相似的错误:http ://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6676175
显示的堆栈跟踪并不相同,但它提到了 revoke_and_rebias 中罕见的竞争条件,该条件已在 6u14 中修复。
EDIT4 - 赏金消息应该说“熟悉热点实现”