当我尝试以下代码时
double start = omp_get_wtime();
long i;
#pragma omp parallel for
for (i = 0; i <= 1000000000; i++) {
double x = rand();
}
double end = omp_get_wtime();
printf("%f\n", end - start);
执行时间约为 168 秒,而顺序版本仅花费 20 秒。
我仍然是并行编程的新手。我怎样才能获得比顺序版本更快的并行版本?