我想在汇编中增加一个 TLS 变量,但在汇编代码中给出了分段错误。我不想让编译器更改任何其他寄存器或内存。有没有办法在不使用 gcc 输入和输出语法的情况下做到这一点?
__thread unsigned val;
int main() {
val = 0;
asm("incl %gs:val");
return 0;
}
如果出于某种原因你真的需要这样做,你应该通过在 C 中预加载它的地址来从汇编语言中访问一个线程局部变量,如下所示:
__thread unsigned val;
void incval(void)
{
unsigned *vp = &val;
asm ("incl\t%0" : "+m" (*vp));
}
这是因为访问线程局部变量所需的代码序列对于 GCC 支持的几乎每个 OS 和 CPU 组合都是不同的,并且如果您正在编译共享库而不是可执行文件(即使用-fPIC
),也会有所不同。上述构造允许编译器为您发出正确的代码序列。在无需任何额外指令即可访问线程局部变量的情况下,地址生成将被折叠到汇编操作中。作为说明,这里是 x86/Linux 的 gcc 4.7 如何以几种不同的可能模式编译上述内容(为了清楚起见,我在所有情况下都删除了一堆汇编程序指令)......
# -S -O2 -m32 -fomit-frame-pointer
incval:
incl %gs:val@ntpoff
ret
# -S -O2 -m64
incval:
incl %fs:val@tpoff
ret
# -S -O2 -m32 -fomit-frame-pointer -fpic
incval:
pushl %ebx
call __x86.get_pc_thunk.bx
addl $_GLOBAL_OFFSET_TABLE_, %ebx
leal val@tlsgd(,%ebx,1), %eax
call ___tls_get_addr@PLT
incl (%eax)
popl %ebx
ret
# -S -O2 -m64 -fpic
incval:
.byte 0x66
leaq val@tlsgd(%rip), %rdi
.value 0x6666
rex64
call __tls_get_addr@PLT
incl (%rax)
ret
Do realize that all four examples would be different if I'd compiled for x86/OSX, and different yet again for x86/Windows.