c++ - 在 .intel_syntax GNU C 内联汇编中引用内存操作数

Question

在使用内联汇编编译和链接源文件时，我遇到了链接错误。

以下是测试文件：

via:$ cat test.cxx
extern int libtest();
int main(int argc, char* argv[])
{
    return libtest();
}

$ cat lib.cxx
#include <stdint.h>
int libtest()
{
    uint32_t rnds_00_15;    
    __asm__ __volatile__
    (
        ".intel_syntax noprefix         ;\n\t"
        "mov DWORD PTR [rnds_00_15], 1  ;\n\t"
        "cmp DWORD PTR [rnds_00_15], 1  ;\n\t"
        "je  done                       ;\n\t"
        "done:                          ;\n\t"
        ".att_syntax noprefix           ;\n\t"
        :
        : [rnds_00_15] "m" (rnds_00_15)
        : "memory", "cc"
    );

    return 0;
}

编译和链接程序会导致：

via:$ g++ -fPIC test.cxx lib.cxx -c
via:$ g++ -fPIC lib.o test.o -o test.exe
lib.o: In function `libtest()':
lib.cxx:(.text+0x1d): undefined reference to `rnds_00_15'
lib.cxx:(.text+0x27): undefined reference to `rnds_00_15'
collect2: error: ld returned 1 exit status

真正的程序更复杂。该例程没有寄存器，因此标志rnds_00_15必须是内存操作数。对 asm 块的使用rnds_00_15是本地的。它在 C 代码中声明以确保在堆栈上分配内存，仅此而已。就 C 代码而言，我们不会读取或写入它。我们将它列为内存输入，以便 GCC 知道我们使用它并在扩展 ASM 中连接“C 变量名”。

为什么我会收到链接错误，我该如何解决？

score 6 · Accepted Answer

编译时gcc -masm=intel不要尝试在 asm 模板字符串中切换模式。AFAIK 没有等价的 clang（请注意，MacOS 默认将 clang 安装为gcc/ g++。）

此外，当然您需要使用有效的 GNU C 内联汇编，使用操作数告诉编译器您要读取和写入哪些 C 对象。

我不相信英特尔语法使用百分号。也许我错过了什么？

%operand您在替换为 Extended-Asm 模板（使用单个 %）与汇编程序看到的最终 asm之间混淆了。

您需要在最终汇编中%%使用文字。%您不会"mov %%eax, 1"在 Intel-syntax inline asm 中使用，但您仍然使用"mov %0, 1"or %[named_operand]。

请参阅https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html。在基本 asm（无操作数）中，没有替换并且 % 在模板中并不特殊，因此如果由于某种原因您没有使用类似 or的操作数，您将mov $1, %eax在 Basic asm 中与Extended 中编写。mov $1, %%eaxmov $1, %[tmp]mov $1, %0

uint32_t rnds_00_15;是一个带有自动存储的本地。当然，没有那个名字的 asm 符号。

使用%[rnds_00_15]和编译-masm=intel （并在最后删除.att_syntax；这会破坏编译器生成的汇编。）

您还需要删除DWORD PTR, 因为操作数扩展已经包含它，例如DWORD PTR [rsp - 4], 和 clang 错误DWORD PTR DWORD PTR [rsp - 4]。（GAS 接受它就好了，但是第二个优先，所以它没有意义并且可能会产生误导。）

"=m"如果您希望编译器在堆栈上为您保留一些暂存空间，您将需要一个输出操作数。您不得修改仅输入的操作数，即使它在 C 语言中未使用。也许编译器决定它可以重叠其他内容，因为它没有被编写和初始化（即 UB）。（我不确定你的"memory"clobber是否使它安全，但没有理由不在这里使用早期的clobber输出操作数。）

并且您将希望通过使用%=来获得唯一编号来避免标签名称冲突。

工作示例（GCC 和 ICC，但不幸的是没有铿锵声），在 Godbolt 编译器资源管理器（-masm=intel根据下拉菜单中的选项使用）。您可以使用“二进制模式”（11010 按钮）来证明它在编译为 asm 后确实可以组装而没有警告。

int libtest_intel()
{
    uint32_t rnds_00_15;
    // Intel syntax operand-size can only be overridden with operand modifiers
    // because the expansion includes an explicit DWORD PTR
    __asm__ __volatile__
    (  // ".intel_syntax noprefix \n\t"
        "mov %[rnds_00_15], 1  \n\t"
        "cmp %[rnds_00_15], 1  \n\t"
        "je  .Ldone%=                 \n\t"
        ".Ldone%=:                    \n\t"
        : [rnds_00_15] "=&m" (rnds_00_15)
        :
        : // no clobbers
    );
    return 0;
}

编译 (with gcc -O3 -masm=intel) 到这个 asm。当然也适用于gcc -m32 -masm=intel：

libtest_intel:
    mov DWORD PTR [rsp-4], 1  
    cmp DWORD PTR [rsp-4], 1  
    je  .Ldone8                 
.Ldone8:                    

    xor     eax, eax
    ret

我无法让它与 clang 一起使用：.intel_syntax noprefix当我明确地将它留在.

操作数大小覆盖：

您必须使用%b[tmp]让编译器替换BYTE PTR [rsp-4]为仅访问 dword 输入操作数的低字节。如果您想做很多这样的事情，我会推荐 AT&T 语法。

使用%[rnds_00_15]结果Error: junk '(%ebp)' after expression.

那是因为您在没有告诉编译器的情况下切换到 Intel 语法。如果您希望它使用 Intel 寻址模式，请进行编译，-masm=intel以便编译器可以使用正确的语法替换到模板中。

这就是为什么我几乎不惜一切代价避免使用糟糕的 GCC 内联汇编。伙计，我鄙视这个糟糕的工具。

你只是用错了。这有点麻烦，但如果你了解它的设计方式，它是有道理的，而且大多数情况下都能很好地工作。

在我之后重复：编译器根本不解析 asm 字符串，除了对%operand. 这就是为什么它没有注意到您.intel_syntax noprefex并继续替换 AT&T 语法的原因。

不过，它在 AT&T 语法中确实可以更好、更轻松地工作，例如，用于覆盖内存操作数的操作数大小，或添加偏移量。（例如4 + %[mem]在 AT&T 语法中工作）。

方言替代品：

如果您想编写不依赖-masm=intel或不依赖的内联汇编，请使用方言替代方案（这会使您的代码超级难看；不推荐用于包装一两条指令之外的任何内容）：

还演示了操作数大小的覆盖

#include <stdint.h>
int libtest_override_operand_size()
{
    uint32_t rnds_00_15;
    // Intel syntax operand-size can only be overriden with operand modifiers
    // because the expansion includes an explicit DWORD PTR
    __asm__ __volatile__
    (
        "{movl $1, %[rnds_00_15] | mov %[rnds_00_15], 1}  \n\t"
        "{cmpl $1, %[rnds_00_15] | cmp %k[rnds_00_15], 1}  \n\t"
        "{cmpw $1, %[rnds_00_15] | cmp %w[rnds_00_15], 1}  \n\t"
        "{cmpb $1, %[rnds_00_15] | cmp %b[rnds_00_15], 1}  \n\t"
        "je  .Ldone%=                     \n\t"
        ".Ldone%=:                        \n\t"
        : [rnds_00_15] "=&m" (rnds_00_15)
    );
    return 0;
}

使用 Intel 语法，gcc 将其编译为：

     mov DWORD PTR [rsp-4], 1  
     cmp DWORD PTR [rsp-4], 1  
     cmp WORD PTR [rsp-4], 1  
     cmp BYTE PTR [rsp-4], 1  
    je  .Ldone38                     
.Ldone38:                        

    xor     eax, eax
    ret

使用 AT&T 语法，编译为：

    movl $1, -4(%rsp)   
    cmpl $1, -4(%rsp)   
    cmpw $1, -4(%rsp)   
    cmpb $1, -4(%rsp)   
    je  .Ldone38                     
.Ldone38:                        

    xorl    %eax, %eax
    ret

c++ - 在 .intel_syntax GNU C 内联汇编中引用内存操作数

1 回答 1

操作数大小覆盖：

方言替代品：

Related

Reference