2

我想编写一些示例代码来测试 Open MP API。我已经做了一个三级 For 循环,并在其中进行了计算。

问题是我的结果是错误的。

这是我的代码:

long value = 0;
#pragma omp parallel
{
#pragma omp for
for (int i=0;i<=9999;i++)
{
    value += (M_PI * i * i -12,33 * M_PI)- M_PI;

    for (int j=0;j<=888;j++)
    {
        value += (M_PI * j * i -12,33 * M_PI)- M_PI;

        for (int k=0;k<=777;k++)
        {
            value += (M_PI * k * j -12,33 * M_PI)- M_PI;    
        }
    }
}
}    

我的问题 :

没有 Open MP,value变量的值为:191773766 Whit Open MP,value变量的值为: 1092397966

我认为这是一个同步问题,但如何解决呢?我已经阅读了很多关于 Open MP 的内容,但我不知道如何解决它。

非常感谢,

此致,

4

1 回答 1

7

你错过了reduction(+:value)条款。

#pragma omp parallel reduction(+:value)  //  add reduction here
{
#pragma omp for

您需要它的原因是因为您value在所有线程之间共享变量。所以他们异步更新它导致竞争条件。(缓存一致性也会对性能造成影响。)

reduction(+:value)子句告诉编译器为每个线程创建一个单独的实例,value然后在最后总结它们。


编辑:应 OP 要求的完整代码。

int main() {

    double start = omp_get_wtime();

    long M_PI = 12;

    long value = 0;
#pragma omp parallel reduction(+:value)
{
#pragma omp for
for (int i=0;i<=9999;i++)
{
    value += (M_PI * i * i -12,33 * M_PI)- M_PI;

    for (int j=0;j<=888;j++)
    {
        value += (M_PI * j * i -12,33 * M_PI)- M_PI;

        for (int k=0;k<=777;k++)
        {
            value += (M_PI * k * j -12,33 * M_PI)- M_PI;    
        }
    }
}
}    
    double end = omp_get_wtime();
    printf("\n\nseconds = %f\n",end - start);

    cout << value << endl;

    system("pause");
    return 0;
}

输出:(没有 OpenMP)

seconds = 0.007816
738123776

输出:(使用 OpenMP - 8 个线程)

seconds = 0.012784
738123776

如果您想要任何加速,您需要使任务更大

于 2012-06-18T20:56:57.193 回答