C++类的数据结构是什么?它在装配级别如何工作?
IF语句是代码行的比较+条件跳转。
数组和字符串是数据的链接。
C++类的数据结构是什么?它在装配级别如何工作?
IF语句是代码行的比较+条件跳转。
数组和字符串是数据的链接。
编译器为所有成员分配偏移量,并在成员的所有加载/存储操作中包括这些:
struct foo {
uint32_t bar;
uint32_t baz;
uint32_t get_baz() { return baz; }
};
uint32_t get_baz_from_foo(foo *f) { return f->baz; }
变为(为简单起见使用 ARM 汇编代码):
foo__get_baz:
; calling convention: this pointer in r3
; load 32 bit value from r3 + 4 bytes into r0
ldr r0, [r3, #4];
; calling convention: return value in r0
; return from subroutine
b lr
get_baz_from_foo:
; calling convention: first parameter in r0
; load 32 bit value from r0 + 4 bytes into r0
ldr r0, [r0, #4]
; calling convention: return value in r0
; return from subroutine
b lr
由于编译后struct
各自class
的布局并没有改变,所以这里的 4 被硬编码到指令流中。
创建实例的工作方式是分配内存,并将分配函数中的指针传递给每个期望指向结构的指针的人:
new__foo:
; two 32 bit integers need 8 bytes
; calling convention: first parameter in r0
mov r0, #8
; call allocator, which will then return to the function invoking new
bra malloc
如果有构造函数
struct foo2 {
foo2() : bar(5), baz(7) { }
uint32_t bar;
uint32_t baz;
uint32_t get_baz() { return baz; }
};
我们最终得到了一种稍微复杂的方法来创建对象(你应该能够在没有注释的情况下弄清楚):
new__foo2:
strdb lr, ![sp]
mov r0, #8
bl malloc
mov r1, #5
str r1, [r0]
mov r1, #7
str r1, [r0, #4]
ldaia lr, ![sp]
b lr
get_baz
实现与类相同foo
。
现在,如果我构造这样一个对象并获得 baz 值:
bl new__foo2
; remember: the this pointer goes to r3
mov r3, r0
bl foo2__get_baz
我最终r0
包含了 value 7
。
对于virtual
方法,会创建一个隐藏数据成员,它是指向函数表的指针:
struct base {
virtual uint32_t get_baz() = 0;
};
struct derived : base {
derived() : baz(5) { }
virtual uint32_t get_baz();
uint32_t bar;
uint32_t baz;
};
变成
new__derived:
strdb lr, ![sp]
mov r0, #12
bl malloc
mov r1, #5
str r1, [r0, #8]
; get the address of the vtable
ldr r1, =vtable__derived
; vtable typically goes to the end of the class defining it
; as this is the base class, it goes before derived's data members
str r1, [r0]
ldria lr, ![sp]
b lr
vtable__derived:
; pointer to function
dw derived__get_baz
derived__get_baz:
ldr r0, [r3, #8]
b lr
调用此函数是间接完成的:
; construct normally
bl new__derived
; here, we forget that this is a "derived" object
; this pointer to r3
mov r3, r0
; get vtable ptr
ldr r0, [r3]
; get function ptr from vtable
ldr r0, [r0]
; call function
bl r0
这里r0
是 now 5
,因为这是构造函数存储在那里的内容。