c++ - 二维字符数组到 CUDA 内核

Question

我需要帮助将 char[][] 转移到 Cuda 内核。这是我的代码：

__global__ 
void kernel(char** BiExponent){
  for(int i=0; i<500; i++)
     printf("%c",BiExponent[1][i]); // I want print line 1
}

int main(){
  char (*Bi2dChar)[500] = new char [5000][500];
  char **dev_Bi2dChar;

  ...//HERE I INPUT DATA TO Bi2dChar

  size_t host_orig_pitch = 500 * sizeof(char);
  size_t pitch;
  cudaMallocPitch((void**)&dev_Bi2dChar, &pitch, 500 * sizeof(char), 5000);
  cudaMemcpy2D(dev_Bi2dChar, pitch, Bi2dChar, host_orig_pitch, 500 * sizeof(char), 5000, cudaMemcpyHostToDevice);
  kernel <<< 1, 512 >>> (dev_Bi2dChar);
  free(Bi2dChar); cudaFree(dev_Bi2dChar);
}

我使用：nvcc.exe" -gencode=arch=compute_20,code=\"sm_20,compute_20\" --use-local-env --cl-version 2012 -ccbin

感谢帮助。

score 1 · Accepted Answer

cudaMemcpy2D实际上并不处理 C 中的二维（即双指针**）数组。请注意，文档表明它需要单指针，而不是双指针。

一般来说，在主机和设备之间移动任意双指针 C 数组比单指针数组更复杂。

如果你真的想处理双指针数组，那么在这个页面的右上角搜索“CUDA 2D Array”，你会发现如何做的各种例子。（例如，@talonmies在这里给出的答案）

通常，更简单的方法是简单地将数组“展平”，以便它可以被单个指针引用，即，char[]而不是char[][]，然后使用索引算法来模拟二维访问。

您的扁平代码看起来像这样：（您提供的代码是一个不可编译的、不完整的代码段，所以我的也是）

#define XDIM 5000
#define YDIM 500

__global__ 
void kernel(char* BiExponent){
  for(int i=0; i<500; i++)
     printf("%c",BiExponent[(1*XDIM)+i]); // I want print line 1
}

int main(){
  char (*Bi2dChar)[YDIM] = new char [XDIM][YDIM];
  char *dev_Bi2dChar;

  ...//HERE I INPUT DATA TO Bi2dChar

  cudaMalloc((void**)&dev_Bi2dChar,XDIM*YDIM * sizeof(char));
  cudaMemcpy(dev_Bi2dChar, &(Bi2dChar[0][0]), host_orig_pitch, XDIM*YDIM * sizeof(char), cudaMemcpyHostToDevice);
  kernel <<< 1, 512 >>> (dev_Bi2dChar);
  free(Bi2dChar); cudaFree(dev_Bi2dChar);
}

如果你想要一个有间距的数组，你可以类似地创建它，但你仍然会这样做作为单指针数组，而不是双指针数组。

score -1 · Accepted Answer

您不能printf在 Cuda 内核中使用。原因是代码是在 GPU 而不是主机 CPU 上执行的。

但是，您可以使用cuPrintf

我们如何使用 cuPrintf()？

c++ - 二维字符数组到 CUDA 内核

2 回答 2

Related

Reference