7

这是“算法”,但是当我想测量执行时间时,它给了我零。为什么?

#define ARRAY_SIZE 10000
...

clock_t start, end;

start = clock();

for( i = 0; i < ARRAY_SIZE; i++) 
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );

那么我应该怎么做才能测量时间呢?

4

2 回答 2

14

两件事情:

  1. 10000在现代计算机上并不多。因此,该循环可能会在不到一毫秒的时间内运行 - 小于clock(). 因此它将返回零。

  2. 如果您不使用non_parallel编译器可能会优化整个循环的结果。

最有可能的是,您只需要一个更昂贵的循环。尝试增加到ARRAY_SIZE更大的东西。


这是在我的机器上进行的具有更大数组大小的测试:

#define ARRAY_SIZE 100000000

int main(){

    clock_t start, end;

    double *non_parallel = (double*)malloc(ARRAY_SIZE * sizeof(double));
    double *vec          = (double*)malloc(ARRAY_SIZE * sizeof(double));

    start = clock();

    for(int i = 0; i < ARRAY_SIZE; i++) 
    {
        non_parallel[i] = vec[i] * vec[i];
    }

    end = clock();
    printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );


    free(non_parallel);
    free(vec);
    return 0;
}

输出:

Number of seconds: 0.446000
于 2012-04-14T15:59:40.400 回答
5

这是一种实际计时秒数的不可靠方法,因为该clock()函数的精度非常低,并且您的循环没有做很多工作。你可以让你的循环做得更多,让它运行得更久,或者使用更好的计时方法。

更高精度的方法是特定于平台的。对于 Windows,请参阅如何使用 QueryPerformanceCounter?对于 linux,请参阅C++ 和 Linux 的高分辨率计时器?

于 2012-04-14T15:59:18.047 回答