2

我有一个奇怪的 jar 文件,它包含一些类,当我使用 JD Decompiler 时,它会显示如下段:

public final void a(ak aa) {
    this.jdField_a_of_type_Ak = aa;
}

public final void a(cn ccn) {
  this.jdField_a_of_type_Cn = ccn;
}

public final cN a() {
  return this.jdField_a_of_type_CN;
}

public final void a() {
  super.b();
}

public final boolean a() {
    return this.jdField_a_of_type_Boolean;
}

我只是想知道为什么编译器/混淆器可以产生这样的类字节码,我的意思是方法签名。有人知道混淆器可以做到这一点吗?

4

4 回答 4

6

Java 字节码支持在 Java 源代码中无效的结构。混淆器通过修改字节码以使用这些结构来利用这一事实(同时仍然给出与未混淆的字节码相同的结果)。

于 2010-12-14T08:28:03.467 回答
5

正如@Joachim Sauer 正确指出的那样:JVM 规范对字节码中方法重载的限制少于 JLS 对 Java 程序的限制。

来自JVM 规范(第 4.6 节,方法)

一个类文件中的两个方法不能具有相同的名称和描述符(第 4.3.3 节)。

并且方法描述符包括返回类型:(4.3.3 方法描述符

MethodDescriptor:
    ( ParameterDescriptor* ) ReturnDescriptor

您在问题中提到的方法都有不同的描述符,所以它们没关系:

public final void a(ak aa)     ->     (Lsomepkg1/ak;)V
public final void a(cn ccn)    ->     (Lsomepkg2/ccn;)V
public final cN a()            ->     ()Lsomepkg3/cN;
public final void a()          ->     ()V
public final boolean a()       ->     ()Z

混淆器巧妙地利用了这一点。一个有效的字节码程序不再有一个“直接对应的”Java 程序。例如, ProGuard就是这样做的。这是他们手册中的一个片段:

-overloadaggressively

指定在混淆时应用积极的重载。然后,多个字段和方法可以获得相同的名称,只要它们的参数和返回类型不同(不仅仅是它们的参数)

还有其他类似的技术,例如使用jsr字节码指令或使用 Java 语言中的保留字变量标识符。是一个列出一些技术的网页。


回答明显的后续问题:JVM 如何知道在调用点调用哪个方法?

调用指令要求您指定对要调用的完整方法签名(包括方法的返回类型)的引用。

于 2010-12-14T08:38:37.493 回答
1

...混淆器会产生这样的方法名称/签名,因为这是它的工作。任何混淆器都应该为此目的工作。

于 2010-12-14T08:25:09.847 回答
1

该类已在没有调试信息的情况下编译(至少缺少局部变量信息)并在以后进行了混淆。

一种基本的混淆策略是用新的、毫无意义的名称替换(几乎)所有包、类和方法名,这样人们就无法理解反编译的代码。

其他策略是混淆字符串并添加无法反编译为 java 代码的字节码结构。

您仍然可以为混淆的类文件创建等效的 java 源代码,但需要付出很大的努力。

于 2010-12-14T08:32:17.027 回答