0

我有以下 C 文件 rdtsc.c 演示了在 CI 中使用 rdtsc() 对 64 位版本和 32 位版本都有条件编译。

#include <stdio.h>


#ifdef X86_64
static inline unsigned long long tick()
{

    unsigned long low, high;
    __asm__ __volatile__("rdtsc" : "=a" (low), "=d" (high));
    return ((unsigned long long)high << 32) | low);
}
#else
static inline unsigned long long tick()
{
     unsigned long long d;
     __asm__ __volatile__ ("rdtsc" : "=A" (d) );
     return d;
}
#endif

int main()
{
        long long res;
        volatile int a = 1;
        volatile int b = 3;
        volatile int c = 0;
        res=tick();
        c = (a + b)*11000;
        res=tick()-res;
        printf("ticks %lld",res);
        return 0;
}

我从 shell 循环运行上述程序,如下所示。

for i in {1..10} ; do { ./a.out ; printf "\n"; } ; done

我得到的输出如下。

ticks 96
ticks 108
ticks 8698
ticks 8613
ticks 108
ticks 84
ticks 96
ticks 108
ticks 96
ticks 96

由于正在执行相同的操作。我当然希望这些值更接近于 urniform。我如何解释值中的这种差异?

4

2 回答 2

1

多任务处理确实应该是答案。当您获得更高的值(~9000)时,您的进程会被抢占。考虑到这一点,看看这些价值观,它们似乎是统一的。

于 2013-08-19T08:03:14.760 回答
1

在多核 CPU 平台上,“TSC”必须首先同步。

您可以使用QueryPerformanceCounterQueryPerformanceFrequency

参考http://lwn.net/Articles/211051

于 2013-08-19T08:06:48.060 回答