1

我目前没有Fermi,但目标平台是tesla/Fermi,我想问的是Fermi是否支持这样的Open MP:

#pragma omp parallel for num_threads(N)

for (int i=0; i<1000; ++i)
{
  int threadID=omp_get_thread_num();
  cudafunctions<<<blocks, threads, 1024, streams[threadID]>>>(input+i*colsizeofinput);
}//where there are N streams created.
4

1 回答 1

1

是的,这样的事情是可能的。OpenMP 在尝试将多个内核启动到同一设备(超出流提供的范围)时并没有提供任何特定的好处,并且如果您的意图是实现内核的并发执行,则它不是必需的。

OpenMP 与 CUDA 的典型用例是管理多个设备

于 2013-03-14T06:13:11.093 回答