我是cuda的新手;我有一个带有 3 个通道(颜色)的 2D 图像(宽度、高度)。我想要的是午餐像这样具有3D 块和2D 网格的内核
kernel_2D_3D<<<dim3(1,m,n), dim3(3,TILEy,TILEz)>>>(float *in, float *out)
我用x表示颜色,用y表示宽度,用z表示高度。我的问题是:如何计算图像的行和列:
- 无符号整数行 = ?
- 无符号整数 Col = ?
我用这个函数来计算全局唯一索引
__device__ int getGlobalIdx_2D_3D()
{
    int blockId = blockIdx.x+ blockIdx.y * gridDim.x; 
    int Idx = blockId * (blockDim.x * blockDim.y * blockDim.z)
                 + (threadIdx.z * (blockDim.x * blockDim.y))
                 + (threadIdx.y * blockDim.x)
                 + threadIdx.x;
    return Idx;
}