1

以分号结尾的空代码行是否等同于 asm("nop") 指令?

volatile int x = 5;

if(x == 5){
  printf("x has not been changed yet\n");
}
else{
  ;//Is this the same as asm("nop") or __asm nop in windows?
  //alternatively could use __asm nop or __nop();
}

我查看了这个答案,这让我不想使用 x86 特定的使用内联汇编的实现。 `__asm nop` 是 GCC 编译器的 `asm volatile("nop");` 的 Windows 等价物吗

我可以使用这个 void __nop(); msdn似乎推荐的功能,但如果我不需要,我不想在库中拖动。 https://docs.microsoft.com/en-us/cpp/intrinsics/nop?view=vs-2017

有没有一种便宜的、可移植的方法来添加一个不会被编译出来的 nop 指令?我认为一个空分号要么是 nop 要么是编译出来的,但由于某种原因我今晚找不到任何关于它的信息。

澄清编辑 我可以使用内联 asm 为 x86 执行此操作,但我希望它是可移植的。我可以使用 Windows 库 __nop() 但我不想将该库导入到我的项目中,这是不受欢迎的开销。

我正在寻找一种更简洁的方法来生成不会被优化的 NOP 指令(最好使用标准 C 语法),可以将其制成 MACRO 并在整个项目中使用,具有最小的开销和工作(或者可以很容易地改进为工作)在 windows/linux/x86/x64 上。

谢谢。

4

2 回答 2

4

我的意思是我不想添加一个库只是为了强制编译器添加一个 NOP。

...以一种独立于编译器设置(例如优化设置)的方式,并且以一种适用于所有 Visual C++ 版本(甚至可能是其他编译器)的方式:

没有机会:只要汇编代码具有 C 代码所描述的行为,编译器就可以自由地生成代码。

而且因为NOP指令不会改变程序的行为,编译器可以自由地添加或忽略它。

即使您找到了一种强制编译器生成的方法NOP:编译器的一个更新或修改某些文件的 Windows 更新,编译器也可能不再生成NOP指令。

我可以使用内联汇编来为 x86 执行此操作,但我希望它是可移植的。

正如我在上面所写的,任何强制编译器编写 a 的NOP方法都只能在特定 CPU 的特定编译器版本上工作。

使用内联汇编,或者__nop()您可能涵盖某个制造商的所有编译器(例如:所有 GNU C 编译器或 Visual C++ 的所有变体等......)。

另一个问题是:您是否明确需要“官方”NOP指令,或者您是否可以接受任何什么都不做的指令?

如果您可以忍受任何(几乎)什么都不做的指令,那么读取全局或静态volatile变量可以替代NOP

static volatile char dummy;
    ...
else
{
    (void)dummy;
}

这应该强制编译器添加一条MOV读取变量的指令dummy

背景:

如果您编写了设备驱动程序,则可以将变量链接dummy到读取变量具有“副作用”的某个位置。示例:读取位于 VGA 显存中的变量会影响屏幕内容!

使用volatile关键字你不仅告诉编译器变量的值可能随时改变,而且读取变量可能会产生这样的效果。

这意味着编译器必须假设不读取变量会导致程序无法正常工作。它无法优化MOV读取变量的(实际上是不必要的)指令。

于 2019-02-28T07:31:39.807 回答
3

以分号结尾的空代码行是否等同于 asm("nop") 指令?

不,当然不是。你可以自己简单地尝试一下。(在您自己的机器上,或在 Godbolt 编译器资源管理器上,https: //godbolt.org/ )

FOO(x);如果扩展为仅仅;因为FOO()在这种情况下的适当定义是空字符串,您不会希望无辜的 CPP 宏引入 NOP 。


__nop()不是库函数。这是一个内在的东西,可以完全按照您的意愿行事。 例如

#ifdef USE_NOP

#ifdef _MSC_VER
#include <intrin.h>
#define NOP() __nop()       // _emit 0x90
#else
// assume __GNUC__ inline asm
#define NOP() asm("nop")    // implicitly volatile
#endif

#else
#define NOP()  // no NOPs
#endif

int idx(int *arr, int b) {
    NOP();
    return arr[b];
}

用 Clang7.0 -O3 for x86-64 Linux 编译到这个 asm

idx(int*, int):
    nop
    movsxd  rax, esi                     # sign extend b
    mov     eax, dword ptr [rdi + 4*rax]
    ret

用 32 位 x86 MSVC 19.16 -O2 -Gv 编译到这个 asm

int idx(int *,int) PROC                                    ; idx, COMDAT
    npad    1                           ; pad with a 1 byte NOP
    mov     eax, DWORD PTR [ecx+edx*4]  ; __vectorcall arg regs
    ret     0

并使用 x64 MSVC 19.16 -O2 -Gv 编译到这个 asm 所有这些都是 Godbolt

int idx(int *,int) PROC                             ; idx, COMDAT
    movsxd  rax, edx
    npad    1                           ; pad with a 1 byte NOP
    mov     eax, DWORD PTR [rcx+rax*4]  ; x64 __vectorcall arg regs
    ret     0

b有趣的是,到 64 位的符号扩展是在 NOP 之前完成的。显然 x64 MSVC 要求(默认情况下)函数以至少 2 字节或更长的指令开头(在 1 字节push指令的序言之后,也许?),因此它们支持使用jmp rel8.


如果你在 1 指令函数中使用它,你会npad 2npad 1在x64 MSVC之前得到一个(2 字节 NOP) :

int bar(int a, int b) {
    __nop();
    return a+b;
}
;; x64 MSVC 19.16
int bar(int,int) PROC                                  ; bar, COMDAT
    npad    2
    npad    1
    lea     eax, DWORD PTR [rcx+rdx]
    ret     0

我不确定 MSVC 对纯寄存器指令的 NOP 重新排序有多积极,但a^=b;在NOP 指令之前__nop()实际上会导致。xor ecx, edx

但是wrt。内存访问,MSVC 决定在这种情况下不重新排序任何东西来填充那个 2 字节的插槽。

int sink;
int foo(int a, int b) {
    __nop();
    sink = 1;
    //a^=b;
    return a+b;
}
;; MSVC 19.16 -O2
int foo(int,int) PROC                                  ; foo, COMDAT
    npad    2
    npad    1
    lea     eax, DWORD PTR [rcx+rdx]
    mov     DWORD PTR int sink, 1             ; sink
    ret     0

__nop()它首先执行 LEA,但在;之前不移动它。似乎明显错过了优化,但是如果您要插入__nop()指令,那么优化显然不是优先事项。


如果你编译成.objor.exe并反汇编,你会看到一个普通的0x90 nop. 但不幸的是,Godbolt 不支持 MSVC,只支持 Linux 编译器,所以我所能做的就是复制 asm 文本输出。

正如您所期望的那样,在__nop()ifdefed 退出后,函数可以正常编译为相同的代码,但没有npad指令。


nop指令将运行与 NOP() 宏在 C 抽象机中运行的次数一样多。 订购wrt。volatile优化器或 wrt 不保证周围的非内存访问。寄存器中的计算。

如果您希望它成为编译时内存重新排序屏障,对于 GNU C,请使用 asm("nop" ::: "memory");`。对于 MSVC,我认为这必须是分开的。

于 2019-02-28T07:05:12.060 回答