1

我想产生一个时钟分辨率的延迟,所以我的想法是一个接一个地有 255 个 NOP,然后跳到最后一个减去所需的延迟。所以 0 会跳过最后一个 NOP,1 会跳过最后一个 NOP,255 会跳过第一个 NOP。

我以前使用过索引函数调用,但在这样的索引 goto 上找不到任何东西。我也想过使用 switch 语句,但这似乎还有其他指令。

任何建议都非常感激。

4

1 回答 1

0

Nick ODell 有一个很好的解决方案,但是编译器无法知道您的所有案例都只有一个字节的代码。在汇编程序通过之前,这将是未知的。因此,无论在每种情况下生成多少代码,编译器都必须生成可以工作的东西,而间接跳转表实际上是唯一的方法。

因此,我认为为了获得每个 nop 一个字节的“理想”代码,您还必须在汇编中编写跳转逻辑。

这是我想出的(用于 Linux 上的 gcc / amd64 / gas)。 这是在godbolt上

#include <stdlib.h>

#define N 1000

#define xstr(s) str(s)
#define str(s) #s


void delay(unsigned ticks) {
  if (ticks <= N) {
    asm("movq $1f, %%rax \n"
    "addq %0, %%rax \n"
    "jmp *%%rax \n"
    "1: \n"
    ".rept " xstr(N) " \n"
    "nop \n"
    ".endr \n"
    : : "g" ((unsigned long)(N-ticks)): "ax");
  } else {
    abort();
  }
}

int main(void) {
  delay(4);
  return 0;
}

请注意,它必须使用-no-pie. 如果您希望它作为与位置无关的可执行文件工作,您可能需要call 2f ; 2f: popq %rax将绝对程序地址放入寄存器之类的技巧。

当然,总是有一个问题,实际获取此代码的开销是否会破坏延迟时间的准确性......

于 2019-02-25T04:45:58.503 回答