java - 在字节码中确定 super() 方法调用在哪里，所有构造函数都必须在 JVM 上执行

Question

我想知道在分析构造函数的字节码时是否有一种明显而快速的方法来确定super()代码的结束位置。

更具体地说，与 Java 形成鲜明对比的是，在构造函数中对任何super()构造函数方法的调用都是可选的（或者更确切地说，当不存在时——隐式），在字节码世界中它总是需要的。

出于黑魔法的目的，我需要仅通过字节码分析和可用的最简单方法INVOKESPECIAL来了解与 Java 世界调用相对应的调用是什么super()。

我会给你一个困难的例子：

public static class A {
    public A(Object o, Object b) {
    }
}

public static class B extends A {
    public B() {
        //the below super is in bold just to signal that's the one
        //I'm looking for
        SUPER(new A(new Object(), new Integer(2)), new Integer(1));
        System.out.println(new A(new Object(), new Integer(2)));
    }
}

使用相应的字节码：在此处输入图像描述

score 4 · Accepted Answer

实际上，字节码构造函数的规则比 Java 的规则要宽松得多。

唯一的规则是在任何正常返回的路径上都必须调用一个构造函数，如果构造函数调用抛出异常，那么您也必须抛出异常。

除此之外，这意味着一个构造函数可能包含对其他构造函数的多个调用，或者根本不包含任何调用。

无论如何，确定给定invokespecial调用是否正在初始化当前对象的唯一有保证的方法是进行数据流分析，因为可以初始化同一类的其他对象，这会使天真的检测器感到困惑。

编辑：这是一个完全有效的类的示例（使用 Krakatau 汇编器语法），显示了您可能遇到的一些问题。除其他外，它调用同一类中的其他构造函数，递归调用构造函数，以及在构造函数中构造同一类的其他对象。

.class public ctors
.super java/lang/Object

; A normal constructor
.method public <init> : ()V
    .limit locals 1
    .limit stack 1

    aload_0
    invokespecial java/lang/Object <init> ()V
    return
.end method

; A weird constructor
.method public <init> : (I)V
    .limit locals 2
    .limit stack 5

    iload_1
    ifne LREST
        aload_0
        invokespecial ctors <init> ()V
        return

LREST:
    aload_0
    new ctors
    iinc 1 -1
    iload_1
LFAKE_START:
    invokespecial ctors <init> (I)V
LFAKE_END:
    iconst_0
    invokespecial ctors <init> (I)V
    return

.catch [0] from LFAKE_START to LFAKE_END using LCATCH
LCATCH:
    aload_0
    invokespecial java/lang/Object <init> ()V
    return
.end method

.method public static main : ([Ljava/lang/String;)V
    .limit locals 1
    .limit stack 2

    new ctors
    iconst_5
    invokespecial ctors <init> (I)V
    return
.end method

score 2 · Accepted Answer

一个简单的解决方案是计算new A对象的数量和A.<init> 当有多个时init调用new超级构造函数。你必须做同样的检查new B，B.<init>以防万一this(...)被调用。

score 1 · Accepted Answer

您必须找出操作数堆栈在哪个调用操作码处包含this将用作第一个参数的引用。为此，您只需要了解不同操作码对操作数堆栈的影响。在您的示例中，您从aload_0（这是this引用）开始，然后在该引用之上做很多魔术（一直更新操作数堆栈）。过了一会儿，您正在寻找的调用操作码就在那里，它消耗了this引用（以及一些参数的引用）。这就是super电话。

score 0 · Accepted Answer

super() 调用的答案是行号。31.

我发现通过 Eclipse 的类文件编辑器很容易。看看下面附上的快照。

这里要记住的一件事是，前缀“a”表示操作码正在操作对象引用。前缀“i”表示操作码正在操作一个整数。

所以，逐行解释如下，

12  new java.lang.Integer //Create a new java.lang.Integer 
15  dup //Make a extra reference to the same Integer
16  iconst_2 // this means opcode is manipulating Integer as Integer(2)
17  invokespecial java.lang.Integer(int) //Integer(2) is invoked
20  invokespecial A(java.lang.Object, java.lang.Object) //new A(new Object(), new Integer(2) is invoked
23  new java.lang.Integer //Create a new java.lang.Integer
26  dup //Make a extra reference to the same Integer
27  iconst_1 // this means opcode is manipulating Integer as Integer(1)
28  invokespecial java.lang.Integer(int) //Integer(1) is invoked
31  invokespecial A(java.lang.Object, java.lang.Object) **//super(new A(new Object(), new Integer(2)), new Integer(1)) is invoked**

我希望后面的内容容易理解。:)

56 - this invoke is for the sysout related A(object,object) invocation.

在此处输入图像描述

java - 在字节码中确定 super() 方法调用在哪里，所有构造函数都必须在 JVM 上执行

4 回答 4

Related

Reference