7

我正在调查我的应用程序中偶尔发生的 JVM 崩溃。hs_err 文件包含有关崩溃的以下详细信息。

#  SIGSEGV (0xb) at pc=0x065e68f4, pid=20208, tid=570166160
#
# Java VM: Java HotSpot(TM) Server VM (10.0-b23 mixed mode linux-x86)

...

# Problematic frame:
# V  [libjvm.so+0x5e68f4]

...

Current thread (0x099ea800):  JavaThread "Thread-315" daemon [_thread_in_vm, id=25782, stack(0x21fa3000,0x21fc1000)]

...

vm_info: Java HotSpot(TM) Server VM (10.0-b23) for linux-x86 JRE (1.6.0_07-b06), built on Jun 10 2008 01:20:15 by "java_re" with gcc 3.2.1-7a (J2SE release)

所以这告诉我 JVM 在运行一些 Java 代码时遇到了段错误。错误日志还包含有关崩溃线程堆栈的信息。

Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code)
V  [libjvm.so+0x5e68f4]
V  [libjvm.so+0x1c054f]
V  [libjvm.so+0x1bfef2]
V  [libjvm.so+0x1bf57f]
V  [libjvm.so+0x592495]
V  [libjvm.so+0x365c4e]
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter

Java frames: (J=compiled Java code, j=interpreted, Vv=VM code)
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
v  ~BufferBlob::Interpreter
J  org.myapp.AppClass.getBytes()Lorg/myapp/ByteHolder;

我已经使用 GDB 从崩溃中连接到核心文件并获取有关堆栈的更多详细信息。这给了我以下输出。

#5  <signal handler called>
#6  0x065e68f4 in interpretedVFrame::monitors() const ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#7  0x061c054f in get_or_compute_monitor_info(JavaThread*) ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#8  0x061bfef2 in revoke_bias(oopDesc*, bool, bool, JavaThread*) ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#9  0x061bf57f in BiasedLocking::revoke_and_rebias(Handle, bool, Thread*) ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#10 0x06592495 in ObjectSynchronizer::fast_enter(Handle, BasicLock*, bool, Thread*) ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so
#11 0x06365c4e in InterpreterRuntime::monitorenter(JavaThread*, BasicObjectLock*) ()
   from /usr/java/jdk1.6.0_07/jre/lib/i386/server/libjvm.so

这表明原始错误报告中列出的六个 libjvm.so 帧与获取 Java 锁有关。但是,我在 org.myapp.AppClass.getBytes() 中找不到任何使用任何锁的代码。

堆栈中的 BufferBlob::Interpreter 行是什么意思?这些是 Java 堆栈帧吗?JVM堆栈帧?是否有可能计算出这些堆栈帧中被调用的内容?

注意:请不要建议我尝试切换到更新的 Hotspot JVM。我依赖 CMS 收集器,而最近的 V1.6 Hotspot JVM 都没有一个足够稳定的 CMS 收集器。

编辑:本文档 (http://www.oracle.com/technetwork/java/javase/tsg-vm-149989.pdf) 指出“v”帧是“VM 生成的存根帧”。知道这意味着什么吗?

EDIT2: org.myapp.AppClass.getBytes() 从 DataInputStream 读取。这可能涉及以下堆栈跟踪:

AppClass.getBytes()
AppClass.readByte()
DataInputStream.readByte()
SocketInputStream.read()
SocketInputStream.read(byte[],int,int)
PlainSocketImpl.aquireFD()

最后一个方法获取锁。这可能是最终调用上面列出的 JVM 代码的来源。上面的这个堆栈有一个简洁的特性,即在 getBytes() 下面有 5 个 Java 堆栈帧。这将与“Java 框架”列表中的 5 行 BufferBlob::Interpreter 完美匹配。

这提出了几个新问题:

  • “Native frames”部分下的 BufferBlob::Interpreter 的 5 行是否可能只是“Java frames”部分下相同行的重复?
  • 为什么错误日志不显示这 5 个堆栈帧的详细信息?

EDIT3 - 这个 Oracle 错误看起来可能是相同/相似的错误:http ://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6676175

显示的堆栈跟踪并不相同,但它提到了 revoke_and_rebias 中罕见的竞争条件,该条件已在 6u14 中修复。

EDIT4 - 赏金消息应该说“熟悉热点实现”

4

2 回答 2

4

VM generated stub frame只是意味着正在执行的代码已经由 JVM 生成。

堆栈本身(来自 gdb)显示 VM 正试图到达安全点,因为它正在撤销偏向锁。您可以在此博客中阅读有关偏向锁定的信息。这意味着某个线程已经获得了一个监视器,该监视器将监视器偏向该线程。后来其他一些线程想要锁,所以它必须撤销需要到达安全点的偏差(即没有线程正在执行字节码,也就是停止世界)。

您的错误也可能表明 JVM 在取消优化某些方法期间崩溃。这意味着 JVM 已经优化(编译)了某些方法,但随后遇到了导致它需要取消优化的代码路径,因为编译的方法不再有效。如果没有 JVM 升级,您不太可能找到解决此问题的方法。

看起来您有 2 种解决方法可以尝试

  1. 如果它是由偏向锁定驱动的,请将其关闭 ( -XX:-UseBiasedLocking)
  2. 如果它是由去优化驱动的,请找到有问题的方法并告诉热点不要首先编译它,有关如何在此链接上执行此操作的说明

这两种方法都可能对性能产生影响。

请注意,如果您可以制定出可靠地重现问题的测试场景,这将不那么令人沮丧。

于 2011-10-28T13:07:08.697 回答
1

这个问题现在已经由 Tom Rodriguez 在hotspot-runtime-dev 邮件列表中回答。

http://mail.openjdk.java.net/pipermail/hotspot-runtime-dev/2011-November/002592.html

于 2011-11-15T10:35:55.703 回答