编译时gcc -masm=intel
不要尝试在 asm 模板字符串中切换模式。AFAIK 没有等价的 clang(请注意,MacOS 默认将 clang 安装为gcc
/ g++
。)
此外,当然您需要使用有效的 GNU C 内联汇编,使用操作数告诉编译器您要读取和写入哪些 C 对象。
我不相信英特尔语法使用百分号。也许我错过了什么?
%operand
您在替换为 Extended-Asm 模板(使用单个 %
)与汇编程序看到的最终 asm之间混淆了。
您需要在最终汇编中%%
使用文字。%
您不会"mov %%eax, 1"
在 Intel-syntax inline asm 中使用,但您仍然使用"mov %0, 1"
or %[named_operand]
。
请参阅https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html。在基本 asm(无操作数)中,没有替换并且 % 在模板中并不特殊,因此如果由于某种原因您没有使用类似 or的操作数,您将mov $1, %eax
在 Basic asm 中与Extended 中编写。mov $1, %%eax
mov $1, %[tmp]
mov $1, %0
uint32_t rnds_00_15;
是一个带有自动存储的本地。当然,没有那个名字的 asm 符号。
使用%[rnds_00_15]
和编译-masm=intel
(并在最后删除.att_syntax
;这会破坏编译器生成的汇编。)
您还需要删除DWORD PTR
, 因为操作数扩展已经包含它,例如DWORD PTR [rsp - 4]
, 和 clang 错误DWORD PTR DWORD PTR [rsp - 4]
。(GAS 接受它就好了,但是第二个优先,所以它没有意义并且可能会产生误导。)
"=m"
如果您希望编译器在堆栈上为您保留一些暂存空间,您将需要一个输出操作数。您不得修改仅输入的操作数,即使它在 C 语言中未使用。也许编译器决定它可以重叠其他内容,因为它没有被编写和初始化(即 UB)。(我不确定你的"memory"
clobber是否使它安全,但没有理由不在这里使用早期的clobber输出操作数。)
并且您将希望通过使用%=
来获得唯一编号来避免标签名称冲突。
工作示例(GCC 和 ICC,但不幸的是没有铿锵声),在 Godbolt 编译器资源管理器(-masm=intel
根据下拉菜单中的选项使用)。您可以使用“二进制模式”(11010 按钮)来证明它在编译为 asm 后确实可以组装而没有警告。
int libtest_intel()
{
uint32_t rnds_00_15;
// Intel syntax operand-size can only be overridden with operand modifiers
// because the expansion includes an explicit DWORD PTR
__asm__ __volatile__
( // ".intel_syntax noprefix \n\t"
"mov %[rnds_00_15], 1 \n\t"
"cmp %[rnds_00_15], 1 \n\t"
"je .Ldone%= \n\t"
".Ldone%=: \n\t"
: [rnds_00_15] "=&m" (rnds_00_15)
:
: // no clobbers
);
return 0;
}
编译 (with gcc -O3 -masm=intel
) 到这个 asm。当然也适用于gcc -m32 -masm=intel
:
libtest_intel:
mov DWORD PTR [rsp-4], 1
cmp DWORD PTR [rsp-4], 1
je .Ldone8
.Ldone8:
xor eax, eax
ret
我无法让它与 clang 一起使用:.intel_syntax noprefix
当我明确地将它留在.
操作数大小覆盖:
您必须使用%b[tmp]
让编译器替换BYTE PTR [rsp-4]
为仅访问 dword 输入操作数的低字节。如果您想做很多这样的事情,我会推荐 AT&T 语法。
使用%[rnds_00_15]
结果Error: junk '(%ebp)' after expression.
那是因为您在没有告诉编译器的情况下切换到 Intel 语法。如果您希望它使用 Intel 寻址模式,请进行编译,-masm=intel
以便编译器可以使用正确的语法替换到模板中。
这就是为什么我几乎不惜一切代价避免使用糟糕的 GCC 内联汇编。伙计,我鄙视这个糟糕的工具。
你只是用错了。这有点麻烦,但如果你了解它的设计方式,它是有道理的,而且大多数情况下都能很好地工作。
在我之后重复:编译器根本不解析 asm 字符串,除了对%operand
. 这就是为什么它没有注意到您.intel_syntax noprefex
并继续替换 AT&T 语法的原因。
不过,它在 AT&T 语法中确实可以更好、更轻松地工作,例如,用于覆盖内存操作数的操作数大小,或添加偏移量。(例如4 + %[mem]
在 AT&T 语法中工作)。
方言替代品:
如果您想编写不依赖-masm=intel
或不依赖的内联汇编,请使用方言替代方案(这会使您的代码超级难看;不推荐用于包装一两条指令之外的任何内容):
还演示了操作数大小的覆盖
#include <stdint.h>
int libtest_override_operand_size()
{
uint32_t rnds_00_15;
// Intel syntax operand-size can only be overriden with operand modifiers
// because the expansion includes an explicit DWORD PTR
__asm__ __volatile__
(
"{movl $1, %[rnds_00_15] | mov %[rnds_00_15], 1} \n\t"
"{cmpl $1, %[rnds_00_15] | cmp %k[rnds_00_15], 1} \n\t"
"{cmpw $1, %[rnds_00_15] | cmp %w[rnds_00_15], 1} \n\t"
"{cmpb $1, %[rnds_00_15] | cmp %b[rnds_00_15], 1} \n\t"
"je .Ldone%= \n\t"
".Ldone%=: \n\t"
: [rnds_00_15] "=&m" (rnds_00_15)
);
return 0;
}
使用 Intel 语法,gcc 将其编译为:
mov DWORD PTR [rsp-4], 1
cmp DWORD PTR [rsp-4], 1
cmp WORD PTR [rsp-4], 1
cmp BYTE PTR [rsp-4], 1
je .Ldone38
.Ldone38:
xor eax, eax
ret
使用 AT&T 语法,编译为:
movl $1, -4(%rsp)
cmpl $1, -4(%rsp)
cmpw $1, -4(%rsp)
cmpb $1, -4(%rsp)
je .Ldone38
.Ldone38:
xorl %eax, %eax
ret