我想知道一些相关的内核结构。内核中的每一行都不可能在 GPU 上运行吗?
例如我有这个代码:
#pragma acc kernels copy(a[0:n],b[0:n])
{
#pragma acc loop
for (i = 0; i < n; i++)
a[i] = i+10;
a[1] = 10;
a[3] = 5;
#pragma acc loop
for (i = 0; i < n; i++)
b[i] = i+20;
}
acc并行结构的情况也一样吗?