9

我想在汇编中增加一个 TLS 变量,但在汇编代码中给出了分段错误。我不想让编译器更改任何其他寄存器或内存。有没有办法在不使用 gcc 输入和输出语法的情况下做到这一点?

__thread unsigned val;
int main() {
  val = 0;
  asm("incl %gs:val");
  return 0;
}
4

1 回答 1

19

如果出于某种原因你真的需要这样做,你应该通过在 C 中预加载它的地址来从汇编语言中访问一个线程局部变量,如下所示:

__thread unsigned val;
void incval(void)
{
  unsigned *vp = &val;
  asm ("incl\t%0" : "+m" (*vp));
}

这是因为访问线程局部变量所需的代码序列对于 GCC 支持的几乎每个 OS 和 CPU 组合都是不同的,并且如果您正在编译共享库而不是可执行文件(即使用-fPIC),也会有所不同。上述构造允许编译器为您发出正确的代码序列。在无需任何额外指令即可访问线程局部变量的情况下,地址生成将被折叠到汇编操作中。作为说明,这里是 x86/Linux 的 gcc 4.7 如何以几种不同的可能模式编译上述内容(为了清楚起见,我在所有情况下都删除了一堆汇编程序指令)......

# -S -O2 -m32 -fomit-frame-pointer
incval:
        incl    %gs:val@ntpoff
        ret

# -S -O2 -m64
incval:
        incl    %fs:val@tpoff
        ret

# -S -O2 -m32 -fomit-frame-pointer -fpic
incval:
        pushl   %ebx
        call    __x86.get_pc_thunk.bx
        addl    $_GLOBAL_OFFSET_TABLE_, %ebx
        leal    val@tlsgd(,%ebx,1), %eax
        call    ___tls_get_addr@PLT
        incl    (%eax)
        popl    %ebx
        ret

# -S -O2 -m64 -fpic
incval:
        .byte   0x66
        leaq    val@tlsgd(%rip), %rdi
        .value  0x6666
        rex64
        call    __tls_get_addr@PLT
        incl    (%rax)
        ret

Do realize that all four examples would be different if I'd compiled for x86/OSX, and different yet again for x86/Windows.

于 2012-11-12T22:24:23.760 回答