2

我正在尝试使用 omp 实现 listranking 问题(也可以通过快捷方式知道)以获得数组 W 的总和前缀。我不知道我是否正确使用了flush pragma ..并且在编译“障碍”时出现警告区域可能不会紧密嵌套在工作共享、关键、有序、主或显式任务区域内”

#include <stdio.h> 
#include <stdlib.h>
#include <math.h>
#include <omp.h>

main(int argc, char *argv[])
{ 
  int Q[9]={1,2,3,4,5,6,7,8,0};
  int W[8]={1,2,3,4,5,6,7,8};
  int i,j=6,id;

  printf("Before:\n");
  for(j=0;j<8;j++)
  printf("%d",W[j]);
  printf("\n");
  #pragma omp parallel for shared(Q,W) private(id) num_threads(7)
  for (i=6; i>=0; i--)
  {
    id= omp_get_thread_num();
    while((Q[i] !=0)&& (Q[Q[i]] !=0))
    { 
      #pragma omp flush(W)

       W[i]=W[i]+W[Q[i]];

      #pragma omp flush(W)

       printf("Am %d \t W[%d]= %d",id,i,W[i]);

     #pragma omp barrier    
     #pragma omp flush(Q)
     Q[i]=Q[Q[i]];
     #pragma omp flush(Q)
     printf("Am %d \n Q[%d]= %d",id,i,Q[i]);
   };
 }
  printf("Result:\n");
  for(j=0; j<8; j++)
   printf("%d \t",W[j]);
   printf("\n");

}

求救啊啊啊啊!

4

1 回答 1

5

您不能在 omp 平行区域内使用屏障,您几乎只能在 omp 平行区域内使用屏障。

这样做的原因是,如果您的循环是从 1 到 N,则内部的屏障将有效地创建 N 个线程,如果 N 很大,这将对性能产生负面影响。

我没有在这里查找算法,但有两个合理的选择是重构使用 2 个并行 for 循环,一个接一个地使用障碍所在的循环,或者重构您的算法以使用 #pragma 并行区域。

我查了列表排名算法,如果你必须使用 openmp,你会很好地找到前缀求和或扫描的实现。

-瑞克

于 2009-12-25T08:02:10.087 回答