2

考虑到符合标准的编译器和体系结构,此问题紧随其后GCCx86-64

我想知道option 1,option 2option 3以下之间是否有任何区别。结果在所有情况下都是相同的,还是会有所不同。如果是这样,有什么区别?

// Option 1
asm volatile(:::"memory");
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);

// Option 2
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);
asm volatile(:::"memory");

// Option 3
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):"memory");
4

1 回答 1

2

选项 1 和 2 将让 CPUID 本身与不相关的非volatile加载/存储重新排序(在一个方向或另一个方向上)。这很可能不是您想要的。

您可以在 CPUID 的两侧设置内存屏障但将 CPUID 本身设置为内存屏障当然更好。


正如 Jester 指出的那样,选项 1 将强制level从内存重新加载,如果它曾经将其地址传递到函数之外,或者它已经一个全局的或static.

(或者决定一个C变量是否可以被使用"memory"clobber的asm修改读取或写入的确切标准是什么。我认为它与优化器用来决定一个变量是否可以保存在一个寄存器中的方法基本相同。对不透明函数的非内联函数调用,因此没有将地址传递到任何地方并且不是 asm 语句的输入的纯局部变量仍然可以存在于寄存器中)。

例如(Godbolt 编译器资源管理器):

void foo(int level){
    int eax, ebx, ecx, edx;
    asm volatile("":::"memory");
    asm volatile("CPUID"
        :  "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
        :  "0"(level)
        :
    );
}

# x86-64 gcc7.3  -O3 -fverbose-asm

    pushq   %rbx  #           # rbx is call-preserved, but we clobber it.
    movl    %edi, %eax      # level, eax
    CPUID
    popq    %rbx    #
    ret

请注意缺少函数 arg 的溢出/重新加载。

通常我会使用 Intel 语法,但对于内联汇编,最好始终使用 AT&T,除非你完全讨厌 AT&T 语法或不知道它。

即使它在内存中开始(i386 System V 调用约定,带有堆栈参数),编译器仍然决定没有其他东西(包括asm带有内存破坏器的语句)可以引用它。但是我们如何区分延迟加载呢?修改屏障前的函数arg,然后在后面使用:

void modify_level(int level){
    level += 1;                  // modify level before the barrier
    int eax, ebx, ecx, edx;
    asm volatile("#mem barrier here":::"memory");
    asm volatile("CPUID"         // then read it after
    :  "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
    :  "0"(level):);
}

asm 输出gcc -m32 -O3 -fverbose-asm为:

modify_level(int):
    pushl   %ebx  #
    #mem barrier here
    movl    8(%esp), %eax   # level, tmp97
    addl    $1, %eax        #, level
    CPUID
    popl    %ebx    #
    ret

请注意,编译器允许level++跨内存屏障重新排序,因为它是一个局部变量。

Godbolt 过滤手写的 asm 注释以及编译器生成的仅 asm 注释行。我禁用了评论过滤器并找到了内存屏障。您可能需要删除 -fverbose-asm 以减少噪音。或者对 mem 屏障使用非注释字符串:如果您只是查看编译器的 asm 输出,则不必组装它。(除非您使用内置汇编器的 clang)。


顺便说一句,您的问题的原始版本没有编译:您将空字符串作为 asm 模板遗漏了。 asm(:::"memory"). output、input 和 clobber 部分可以为空,但 asm 指令字符串不是可选的。

有趣的是,您可以在字符串中添加 asm 注释:

asm volatile("# memory barrier here":::"memory");

gcc 在%whatever编写 asm 输出时会填充字符串模板中的任何内容,因此您甚至可以执行类似操作"CPUID # %%0 was in %0"并查看 gcc 为您的“虚拟”args 选择的内容,这些参数在 asm 模板中未提及。"memory"(当你给 asm 语句一个指针时,这对于虚拟内存输入/输出操作数告诉编译器你读/写哪个内存而不是使用 clobber 更有趣。)

于 2018-01-31T05:34:11.533 回答