我编写了自己的链接脚本,将不同的变量放在两个不同的数据部分(A 和 B)中。
A 链接到零地址;B 链接到代码附近,并且在高地址空间中(高于 4G,这不适用于 x86-64 中的正常绝对寻址)。
A 可以通过绝对寻址访问,但不能通过 RIP-relative 访问;B可以通过RIP-relative寻址访问,但不是绝对的;
我的问题:有没有办法为 gcc 中的不同变量选择相对 RIP 或绝对寻址?也许有一些注释,比如#pragma
?
我编写了自己的链接脚本,将不同的变量放在两个不同的数据部分(A 和 B)中。
A 链接到零地址;B 链接到代码附近,并且在高地址空间中(高于 4G,这不适用于 x86-64 中的正常绝对寻址)。
A 可以通过绝对寻址访问,但不能通过 RIP-relative 访问;B可以通过RIP-relative寻址访问,但不是绝对的;
我的问题:有没有办法为 gcc 中的不同变量选择相对 RIP 或绝对寻址?也许有一些注释,比如#pragma
?
如果不破解 GCC 源代码,您不会让它发出32 位绝对地址,但在某些情况下 gcc 将使用 64 位绝对地址。
-mcmodel=medium
将大对象放入单独的部分,对大数据部分使用 64 位绝对地址。(所有对象都必须同意的大小阈值,由 设置-mlarge-data-threshold=
)。但仍然对所有其他变量使用 RIP-relative。
有关不同内存模型的更多信息,请参阅 x86-64 System V ABI 文档。和/或 GCC 文档-mcmodel=
和-mlarge-data-threshold=
:https
://gcc.gnu.org/onlinedocs/gcc/x86-Options.html
默认是-mcmodel=small
:一切都在 2GiB 之内,所以 RIP 相对有效。对于非 PIE 可执行文件,这是低 2GiB 的虚拟地址空间,因此静态地址可以是 32 位绝对符号或零扩展立即数或寻址模式下的 disp32。
int a[1000000];
int b[1];
int fa() { return a[0]; }
int fb() { return b[0]; }
ASM 输出(Godbolt):
# gcc9.2 -O3 -mcmodel=medium
fa():
movabs eax, DWORD PTR [a] # 64-bit absolute address, special encoding for EAX
ret
fb():
mov eax, DWORD PTR b[rip]
ret
对于加载到 AL/AX/EAX/RAX 以外的寄存器,GCC 将使用movabs r64, imm64
地址,然后使用mov reg, [reg]
.
您不会让 gcc 对 A 部分使用32 位绝对寻址。 它将始终使用 64 位绝对寻址,从不[array + rdx*4]
或[abs foo]
(NASM 语法)。永远不要mov edi, msg
(imm32)将地址放入寄存器中,总是mov rdi, qword msg
(imm64)。
GCC 放在b
section.lbss
和a
regular 中.bss
。大概你可以__attribute__((section("name")))
使用
.globl b
.section .lbss,"aw" # "aw" = allocate(?), writeable
.align 32
.size b, 4000000
b:
.zero 4000000
.globl a
.bss # shortcut for .section
.align 4
a:
.zero 4
不起作用的事情:
__attribute__((optimize("mcmodel=large")))
在每个功能的基础上。实际上不起作用,并且无论如何都是按功能而不是按变量。https://gcc.gnu.org/onlinedocs/gcc/Variable-Attributes.html没有记录与内存模型或大小相关的任何 x86 或常见变量属性。唯一特定于 x86 的变量属性是 ms 与 gcc 结构布局。
函数和类型有特定于 x86 的属性,但这些都没有帮助。
将所有 A 部分变量放在一个比任何 B 部分全局/静态对象都大的大型 struct 中。可能在最后用一个虚拟数组填充它以使其更大:您的链接描述文件可能会避免实际为该虚拟数组分配额外的空间。
-mcmodel=medium mlarge-data-threshold=
然后用那个大小编译。