objective-c - 究竟什么是`objc_msgSend_fixup`？

Question

我在弄乱 Objective-C 运行时，试图编译 Objective-c 代码而不将其链接到libobjc，并且我在程序中遇到了一些分段错误问题，因此我从中生成了一个汇编文件。我认为没有必要显示整个程序集文件。在我的main函数的某个时刻，我有以下行（顺便说一句，这是我得到 seg 错误的那一行）：

callq   *l_objc_msgSend_fixup_alloc

这是的定义l_objc_msgSend_fixup_alloc：

.hidden l_objc_msgSend_fixup_alloc # @"\01l_objc_msgSend_fixup_alloc"
    .type   l_objc_msgSend_fixup_alloc,@object
    .section    "__DATA, __objc_msgrefs, coalesced","aw",@progbits
    .weak   l_objc_msgSend_fixup_alloc
    .align  16
l_objc_msgSend_fixup_alloc:
    .quad   objc_msgSend_fixup
    .quad   L_OBJC_METH_VAR_NAME_
    .size   l_objc_msgSend_fixup_alloc, 16

我已经重新实现objc_msgSend_fixup了一个函数 ( id objc_msgSend_fixup(id self, SEL op, ...))，它返回nil（只是为了看看会发生什么），但是这个函数甚至没有被调用（程序在调用它之前崩溃了）。

所以，我的问题是，callq *l_objc_msgSend_fixup_alloc应该做什么以及objc_msgSend_fixup（之后l_objc_msgSend_fixup_alloc:）应该是什么（函数或对象）？

编辑

为了更好地解释，我没有将我的源文件链接到 objc 库。我正在尝试做的是实现库的某些部分，只是为了看看它是如何工作的。这是我所做的一种方法：

#include <stdio.h>
#include <objc/runtime.h>

@interface MyClass {

}
+(id) alloc;
@end

@implementation MyClass
+(id) alloc {
  // alloc the object
  return nil;
}
@end

id objc_msgSend_fixup(id self, SEL op, ...) {
  printf("Calling objc_msgSend_fixup()...\n");

  // looks for the method implementation for SEL in self's method list

  return nil;   // Since this is just a test, this function doesn't need to do that
}

int main(int argc, char *argv[]) {
    MyClass *m;
    m = [MyClass alloc];    // At this point, according to the assembly code generated
    // objc_msgSend_fixup should be called. So, the program should, at least, print
    // "Calling objc_msgSend_fixup()..." on the screen, but it crashes before
    // objc_msgSend_fixup() is called...

    return 0;
}

如果运行时需要访问对象的 vtable 或对象类的方法列表来找到要调用的正确方法，那么实际执行此操作的函数是什么？我认为是objc_msgSend_fixup，在这种情况下。因此，当objc_msgSend_fixup被调用时，它会接收一个对象作为其参数之一，并且，如果该对象尚未初始化，则该函数将失败。

所以，我已经实现了我自己的objc_msgSend_fixup. 根据上面的汇编源码，应该是这样调用的。函数是否真的在寻找作为参数传递的选择器的实现并不重要。我只是想objc_msgSend_lookup被叫。但是，它没有被调用，也就是说，查找对象数据的函数甚至没有被调用，而是被调用并导致错误（因为它返回 a nil（顺便说一句，没关系）） . objc_msgSend_lookup程序段在被调用之前失败...

编辑 2

更完整的组装片段：

.globl  main
    .align  16, 0x90
    .type   main,@function
main:                                   # @main
.Ltmp20:
    .cfi_startproc
# BB#0:
    pushq   %rbp
.Ltmp21:
    .cfi_def_cfa_offset 16
.Ltmp22:
    .cfi_offset %rbp, -16
    movq    %rsp, %rbp
.Ltmp23:
    .cfi_def_cfa_register %rbp
    subq    $32, %rsp
    movl    $0, %eax
    leaq    l_objc_msgSend_fixup_alloc, %rcx
    movl    $0, -4(%rbp)
    movl    %edi, -8(%rbp)
    movq    %rsi, -16(%rbp)
    movq    L_OBJC_CLASSLIST_REFERENCES_$_, %rsi
    movq    %rsi, %rdi
    movq    %rcx, %rsi
    movl    %eax, -28(%rbp)         # 4-byte Spill
    callq   *l_objc_msgSend_fixup_alloc
    movq    %rax, -24(%rbp)
    movl    -28(%rbp), %eax         # 4-byte Reload
    addq    $32, %rsp
    popq    %rbp
    ret

对于l_objc_msgSend_fixup_alloc，我们有：

.hidden l_objc_msgSend_fixup_alloc # @"\01l_objc_msgSend_fixup_alloc"
    .type   l_objc_msgSend_fixup_alloc,@object
    .section    "__DATA, __objc_msgrefs, coalesced","aw",@progbits
    .weak   l_objc_msgSend_fixup_alloc
    .align  16
l_objc_msgSend_fixup_alloc:
    .quad   objc_msgSend_fixup
    .quad   L_OBJC_METH_VAR_NAME_
    .size   l_objc_msgSend_fixup_alloc, 16

对于L_OBJC_CLASSLIST_REFERENCES_$_：

.type   L_OBJC_CLASSLIST_REFERENCES_$_,@object # @"\01L_OBJC_CLASSLIST_REFERENCES_$_"
    .section    "__DATA, __objc_classrefs, regular, no_dead_strip","aw",@progbits
    .align  8
L_OBJC_CLASSLIST_REFERENCES_$_:
    .quad   OBJC_CLASS_$_MyClass
    .size   L_OBJC_CLASSLIST_REFERENCES_$_, 8

OBJC_CLASS_$_MyClass是指向MyClass结构定义的指针，它也是由编译器生成的，它也存在于汇编代码中。

score 11 · Accepted Answer

要了解objc_msgSend_fixup它是什么以及它做了什么，有必要确切地知道在 Objective-C 中消息发送是如何执行的。有一天，所有的 ObjC 程序员都听说编译器将[obj message]语句转换为objc_msgSend(obj, sel_registerName("message"))调用。然而，这并不完全准确。

为了更好地说明我的解释，请考虑以下 ObjC 片段：

[obj mesgA];
[obj mesgB];

[obj mesgA];
[obj mesgB];

在此代码段中，两条消息被发送到obj，每条消息被发送两次。因此，您可能会想象生成了以下代码：

objc_msgSend(obj, sel_registerName("mesgA"));
objc_msgSend(obj, sel_registerName("mesgB"));
objc_msgSend(obj, sel_registerName("mesgA"));
objc_msgSend(obj, sel_registerName("mesgB"));

但是sel_registerName可能成本太高，并且在调用特定方法时调用它不是明智的做法。然后，编译器为要发送的每条消息生成如下结构：

typedef struct message_ref {
    id (*trampoline) (id obj, struct message_ref *ref, ...);
    union {
        const char *str;
        SEL sel;
    };
} message_ref;

所以，在上面的例子中，当程序启动时，我们有这样的东西：

message_ref l_objc_msgSend_fixup_mesgA = { &objc_msgSend_fixup, "mesgA" };
message_ref l_objc_msgSend_fixup_mesgB = { &objc_msgSend_fixup, "mesgB" };

当需要将这些消息发送到obj时，编译器会生成等效于以下内容的代码：

l_objc_msgSend_fixup_mesgA.trampoline(obj, &l_objc_msgSend_fixup_mesgA, ...);   // [obj mesgA];
l_objc_msgSend_fixup_mesgB.trampoline(obj, &l_objc_msgSend_fixup_mesgB, ...);   // [obj mesgB];

在程序启动时，消息引用蹦床是指向objc_msgSend_fixup函数的指针。对于 each message_ref，当它的trampoline指针第一次被调用时，objc_msgSend_fixup被称为接收obj消息必须发送到的目标以及message_ref调用它的结构。因此，objc_msgSend_fixup必须做的是获取要调用的消息的选择器。因为，对于每个消息引用，这必须只执行一次，还必须用指向另一个不修复消息选择器的函数的指针objc_msgSend_fixup替换 ref 的字段。trampoline调用此函数objc_msgSend_fixedup（选择器已修复）。现在已经设置了消息选择器并且不必再次执行此操作，objc_msgSend_fixup只需调用objc_msgSend_fixedup，这只是调用objc_msgSend. 之后，如果trampoline再次调用消息引用，则它的选择器已经固定，并且objc_msgSend_fixedup是被调用的选择器。

简而言之，我们可以这样objc_msgSend_fixup写objc_msgSend_fixedup：

id objc_msgSend_fixup(id obj, struct message_ref *ref, ...) {
    ref->sel = sel_registerName(ref->str);
    ref->trampoline = &objc_msgSend_fixedup;
    objc_msgSend_fixedup(obj, ref, ...);
}

id objc_msgSend_fixedup(id obj, struct message_ref *ref, ...) {
    objc_msgSend(obj, ref->sel, ...);
}

这使得消息发送更快，因为只有在第一次调用消息时（通过objc_msgSend_fixup）才发现适当的选择器。在以后的调用中，已经找到了选择器，并且直接使用objc_msgSend(by objc_msgSend_fixedup) 调用了消息。

在问题的汇编代码中，l_objc_msgSend_fixup_alloc方法alloc的message_ref结构和分段错误可能是由其第一个字段中的问题引起的（也许它没有指向objc_msgSend_fixup...）

score 7 · Accepted Answer

好的，您的代码是 Objective-C，而不是 C。

编辑/关于 objc_msgSend_fixup

objc_msgSend_fixup是内部 Objective-C 运行时的东西，用于使用 C++ 风格的方法 vtable 管理调用。

您可以在这里阅读一些关于此的文章：

编辑/结束

现在关于你的段错误。

Objective-C 使用运行时进行消息传递、分配等。

消息传递（方法调用）通常由objc_msgSend函数完成。
这就是你这样做时使用的：

[ someObject someFunction: someArg ];

它被翻译成：

objc_msgSend( someObject, @selector( someFunction ), someArg );

因此，如果您在这样的运行时函数中存在段错误，例如objc_msgSend_fixup_alloc，这当然意味着您在未初始化的指针（如果不使用 ARC）或已释放的对象上调用方法。

就像是：

NSObject * o;

[ o retain ]; // Will segfault somewhere in the Obj-C runtime in non ARC, as 'o' may point to anything.

或者：

NSObject * o;

o = [ [ NSObject alloc ] init ];

[ o release ];
[ o retain ]; // Will segfault somewhere in the Obj-C runtime as 'o' is no longer a valid object address.

因此，即使段错误位置在运行时中，这肯定是一个基本的 Objective-C 内存管理问题，在您自己的代码中。

尝试启用 NSZombie，它应该会有所帮助。
也试试静态分析器。

编辑 2

它在运行时崩溃，因为运行时需要访问对象的 vtable 以找到要调用的正确方法。

由于对象无效，vtable 查找导致无效指针的取消引用。

这就是为什么段错误位于此处的原因。

编辑 3

你说你没有与 objc 库链接。
你怎么称呼«objc 库»？

我问这个是因为，正如我们在您的代码中看到的那样，您肯定使用的是 Objective-C 编译器。

例如，您可能不会与提供基础对象的 «Foundation» 框架链接，但由于您使用的是 Objective-C 编译器，libobjc库（提供运行时）仍将被隐式链接。

你确定不是这样吗？nm在生成的二进制文件上尝试一个简单的。

编辑 4

如果确实如此，objc_msgSend_fixup则不是为了重新创建运行时而要做的第一个函数。

当你定义一个类时，运行时需要知道它，所以你需要编写类似objc_allocateClassPair和朋友的东西。

您还需要确保编译器不会使用快捷方式。

我在你身上看到过这样的代码：L_OBJC_CLASSLIST_REFERENCES_$_.

这个符号是否存在于您自己的版本中？

objective-c - 究竟什么是`objc_msgSend_fixup`？

2 回答 2

Related

Reference