c - 在 gcc 32 位代码中未定义的对“_GLOBAL_OFFSET_TABLE_”的引用，用于一个简单的函数，独立的操作系统

Question

我有一个小的 c 代码文件（function.c）：

int function()
{
    return 0x1234abce;
}

我使用的是 64 位机器。但是，我想写一个小的 32 位操作系统。我想将代码编译成“纯”程序集/二进制文件。

我编译我的代码：

gcc function.c -c -m32 -o file.o -ffreestanding # This gives you the object file

我将它与：

ld -o function.bin -m elf_i386 -Ttext 0x0 --oformat binary function.o

我收到以下错误：

function.o: In function `function':
function.c:(.text+0x9): undefined reference to `_GLOBAL_OFFSET_TABLE_'

score 4 · Accepted Answer

你需要-fno-pie；默认（在大多数现代发行版中）是-fpie：为与位置无关的可执行文件生成代码。这是一个与链接器选项分开的代码生成-pie选项（默认情况下 gcc 也通过），并且独立于-ffreestanding. -fpie -ffreestanding意味着您想要一个使用 GOT 的独立 PIE，这就是 GCC 的目标。

-fpie仅在 64 位代码中花费一点速度（其中 RIP 相对寻址是可能的），但对于 32 位代码来说非常糟糕；编译器在其中一个整数寄存器中获得指向 GOT 的指针（占用 8 个寄存器中的另一个），并使用[reg + disp32]寻址模式访问相对于该地址的静态数据，例如[eax + foo@GOTOFF]

禁用优化gcc -fpie -m32后，即使函数不访问任何静态数据，也会在寄存器中生成 GOT 的地址。如果您查看编译器输出（gcc -S而不是-c在您正在编译的机器上），您会看到这一点。

在 Godbolt 上，我们可以使用-m32 -fpie与配置 GCC 相同的效果--enable-default-pie：

# gcc9.2 -O0 -m32 -fpie
function():
        push    ebp
        mov     ebp, esp                        # frame pointer
        call    __x86.get_pc_thunk.ax
        add     eax, OFFSET FLAT:_GLOBAL_OFFSET_TABLE_  # EAX points to the GOT
        mov     eax, 305441742                  # overwrite with the return value
        pop     ebp
        ret

__x86.get_pc_thunk.ax:          # this is the helper function gcc calls
        mov     eax, DWORD PTR [esp]
        ret

“thunk”返回它的返回地址。即 . 之后的指令地址call。该.ax名称的意思是在 EAX 中返回。现代 GCC 可以选择任何寄存器；传统上，32 位 PIC 基址寄存器始终是 EBX，但现代 GCC 在避免额外保存/恢复 EBX 时选择了一个 call-clobbered 寄存器。

有趣的事实：call +0; pop eax效率更高，每个呼叫站点只增加 1 个字节。您可能会认为这会使返回地址预测器堆栈失衡，但实际上call +0大多数 CPU 都不会这样做。 http://blog.stuffedcow.net/2018/04/ras-microbenchmarks/#call0。（call +0表示 rel32 = 0，因此它调用下一条指令。不过，NASM 不会这样解释该语法。）

除非需要，否则 clang 不会生成 GOT 指针，即使在-O0. 但它是这样做的call +0；pop %eax：https ://godbolt.org/z/GFY9Ht

score 3 · Accepted Answer

默认情况下，您的编译器会创建一个与位置无关的可执行文件。

您可以通过传递选项来强制编译器构建非饼图可执行文件-fno-pie。

c - 在 gcc 32 位代码中未定义的对“_GLOBAL_OFFSET_TABLE_”的引用，用于一个简单的函数，独立的操作系统

2 回答 2

Related

Reference