4

我正在以三种不同的频率在三台不同的计算机上分析一些代码。我需要频率来测量 GFLOPs/s。我有一些代码可以做到这一点,但它不考虑 Turboboost。例如,在我的 2600k CPU 上,它报告为 3.4 GHz,但是当我运行 CPUz 时,我可以看到我的 CPU 以 4.3 GHz(超频)运行,因为我的代码使用了所有内核。

#include "stdint.h"
#include "stdio.h"
#include "omp.h"
int main() {
    int64_t cycles = rdtsc(); double dtime = omp_get_wtime();
    //run some code which uses all cores for a while (few ms)   
    dtime = omp_get_wtime() - dtime;
    cycles = rdtsc() - cycles;
    double freq = (double)cycles/dtime*1E-9;
    printf("freq %.2f GHz\n", freq);
}
__int64 rdtsc() {
#ifdef _WIN32
    return __rdtsc();
#else
  uint64_t t;
  asm volatile ("rdtsc" : "=A"(t));
  return t;
#endif
}  

我知道这个问题已经被问过很多次,有不同的答案,但我仍然不清楚这是否可以做到。我不在乎黑客试图更改计时器。此代码仅供我自己使用。是否有可能在代码中获得实际频率?这是如何在 Linux 上完成的?我在 linux 上找到的每个示例都给出了基本频率(或者可能是最大值),但没有像 CPUz 那样给出负载下的工作频率。

编辑:我找到了一个用于 Linux 的程序 Powertop,它似乎显示了实际的运行频率。由于源代码可用,也许可以弄清楚如何在我自己的代码中获得实际频率。

4

1 回答 1

0

我终于解决了这个问题。无需设备驱动程序或读取特殊计数器即可测量代码中的实际工作频率。

基本上,您为具有携带循环依赖性的操作计时一个循环,该循环依赖性总是需要相同的延迟。例如

for(int i=0; i<spinCount; i++) {
    x = _mm_add_ps(x,_mm_set1_ps(1.0f));
}

您在绑定到每个物理核心(非逻辑)核心的线程中运行此循环。要求系统中没有其他线程然后这些线程占用任何大量的 CPU 时间,因此这种方法并不总是给出正确的答案,但在我的情况下它工作得很好。在单插槽系统和多插槽系统上,我得到的结果与 Nahalem、Ivy Bridge 和 Haswell 上的一个线程和多个线程的正确涡轮频率偏差小于 0.5%。我在how-can-i-programmatically-find-the-cpu-frequency-with-c中描述了这个细节,所以我不会在这里重复所有细节。

于 2014-08-21T08:20:50.003 回答