0

我有以下代码:

#pragma omp parallel shared(a,n) private(i,j,k,x,pid,rows,mymin,mymax)
{
    //  nprocs=1;
#ifdef _OPENMP
    nprocs=omp_get_num_threads();
#endif

#ifdef _OPENMP
    pid=omp_get_thread_num();
#endif

    rows=n/nprocs;
    mymin=pid * rows;
    mymax=mymin + rows - 1;

    for(k=0;k<n;k++){
        if(k>=mymin && k<=mymax){
#pragma omp for schedule(static,rows)
            for(x=k+1;x<n;x++){
                a[k][x]= a[k][x]/a[k][k];
            }
#pragma omp barrier
        }
    }
}

在这里,我选择哪个线程将根据 if 条件更新矩阵的哪一行。例如,如果有两个线程,线程 1 将更新矩阵“a”的前两行,线程 2 将更新另外两行。

在我选择它之后,我通过在线程 1 和线程 2(我开始的地方)之间并行内部循环来划分该行列上的迭代 for(x=k+1,x<n;x++)。我还在内部 for 循环之后放置了一个障碍,以便在更新单行的每一列值之后,它的同步。

但问题是我没有得到正确的同步值。在最终的矩阵中,线程 0 更新的一些值显示在一些行中,一些由其他线程显示,但不是全部。

4

1 回答 1

1

在这里使用是没有用的,因为除非指定子句,否则在构造omp barrier的末尾有一个隐式障碍。omp fornowait

另一方面,您不需要手动指定如何将工作分解为线程,并且您的分解方式是不正确的。

您实际上尝试做的事情可以写成如下。

#pragma omp parallel for shared(a,n) private(k,x)
for(k=0;k<n;k++){
    for(x=k+1;x<n;x++){
        a[k][x]= a[k][x]/a[k][k];
    }
}

由于不同的工作负载不平衡k,您可能还需要使用schedule(dynamic, ...)子句。有关更多信息,请参阅 omp 文档。

http://msdn.microsoft.com/en-us/library/b5b5b6eb.aspx

于 2013-10-14T04:01:06.237 回答