0

我的问题与OpenMP 的声明目标构造和 GPU 的动态/嵌套并行特性有关。OpenACC 2.0 以两种方式支持动态并行;例程指令并以嵌套方式使用并行/内核指令。但是在 OpenMP 中禁止使用嵌套的设备指令,例如 target、teams 或distribute。但是在我看来,声明目标指令与 OpenACC 的常规指令相似。

然而,它仍然不清楚语义及其用法。我的示例代码是这样的。

#pragma omp declare target
void foo(){

  //work-1

#pragma omp target teams distribute parallel for 
for(...)
{
    if(...){
       foo();
    {
      //work-2
    }
}

//work-3
}
#pragma omp end declare target

int main(){
//work 

foo();

}

在那个例子中,我期望函数 foo 将被映射为设备函数。但由于它内部有目标构造,编译器将以某种方式转换此代码。我的问题是,当线程在目标构造中遇到 foo 函数调用时会发生什么?

4

1 回答 1

1

目前 OpenMP 不支持目标区域的嵌套。所以你的代码很可能无法编译。或者当遇到嵌套目标构造时,它可能会在运行时崩溃。或者产生意想不到的结果。基本上不合格程序的结果是未指定的。

于 2015-08-18T08:01:54.190 回答