3

我编写了自己的链接脚本,将不同的变量放在两个不同的数据部分(A 和 B)中。

A 链接到零地址;B 链接到代码附近,并且在高地址空间中(高于 4G,这不适用于 x86-64 中的正常绝对寻址)。

A 可以通过绝对寻址访问,但不能通过 RIP-relative 访问;B可以通过RIP-relative寻址访问,但不是绝对的;

我的问题:有没有办法为 gcc 中的不同变量选择相对 RIP 或绝对寻址?也许有一些注释,比如#pragma

4

1 回答 1

1

如果不破解 GCC 源代码,您不会让它发出32 位绝对地址,但在某些情况下 gcc 将使用 64 位绝对地址。


-mcmodel=medium将大对象放入单独的部分,对大数据部分使用 64 位绝对地址。(所有对象都必须同意的大小阈值,由 设置-mlarge-data-threshold=)。但仍然对所有其他变量使用 RIP-relative。

有关不同内存模型的更多信息,请参阅 x86-64 System V ABI 文档。和/或 GCC 文档-mcmodel=-mlarge-data-threshold=https
://gcc.gnu.org/onlinedocs/gcc/x86-Options.html 默认是-mcmodel=small:一切都在 2GiB 之内,所以 RIP 相对有效。对于非 PIE 可执行文件,这是低 2GiB 的虚拟地址空间,因此静态地址可以是 32 位绝对符号或零扩展立即数或寻址模式下的 disp32。

int a[1000000];
int b[1];

int fa() {   return a[0];  }
int fb() {   return b[0];  }

ASM 输出(Godbolt):

# gcc9.2 -O3 -mcmodel=medium
fa():
        movabs  eax, DWORD PTR [a]     # 64-bit absolute address, special encoding for EAX
        ret
fb():
        mov     eax, DWORD PTR b[rip]
        ret

对于加载到 AL/AX/EAX/RAX 以外的寄存器,GCC 将使用movabs r64, imm64地址,然后使用mov reg, [reg].

您不会让 gcc 对 A 部分使用32 位绝对寻址。 它将始终使用 64 位绝对寻址,从不[array + rdx*4][abs foo](NASM 语法)。永远不要mov edi, msg(imm32)将地址放入寄存器中,总是mov rdi, qword msg(imm64)。

GCC 放在bsection.lbssaregular 中.bss。大概你可以__attribute__((section("name")))使用

        .globl  b
        .section        .lbss,"aw"           # "aw" = allocate(?), writeable
        .align 32
        .size   b, 4000000
b:
        .zero   4000000

        .globl  a
        .bss                      # shortcut for .section
        .align 4
a:
        .zero   4

不起作用的事情:

  • __attribute__((optimize("mcmodel=large")))在每个功能的基础上。实际上不起作用,并且无论如何都是按功能而不是按变量。
  • https://gcc.gnu.org/onlinedocs/gcc/Variable-Attributes.html没有记录与内存模型或大小相关的任何 x86 或常见变量属性。唯一特定于 x86 的变量属性是 ms 与 gcc 结构布局。

    函数和类型有特定于 x86 的属性,但这些都没有帮助。


可能的黑客攻击:

将所有 A 部分变量放在一个比任何 B 部分全局/静态对象都大的大型 struct 中。可能在最后用一个虚拟数组填充它以使其更大:您的链接描述文件可能会避免实际为该虚拟数组分配额外的空间。

-mcmodel=medium mlarge-data-threshold=然后用那个大小编译。

于 2019-09-26T02:08:26.360 回答