memory - 如何将所有可用的共享内存分配给 CUDA 中的单个块？

Question

我想将 SM 的所有可用共享内存分配给一个块。我这样做是因为我不希望将多个块分配给同一个 SM。我的 GPU 卡有 64KB（共享+L1）内存。在我当前的配置中，48KB 分配给共享内存，16KB 分配给 L1。我编写了以下代码来使用所有可用的共享内存。

   __global__ void foo()
{

  __shared__ char array[49152];
...

}

我有两个问题：

提前致谢，

伊曼

score 2 · Accepted Answer

您可以从中读取可用设备共享内存的大小cudaDeviceProp::sharedMemPerBlock，您可以通过调用获得cudaGetDeviceProperties
您不必指定数组的大小。相反，您可以动态传递共享内存的大小作为第三个内核启动参数。

“时钟”CUDA SDK 示例说明了如何在启动时指定共享内存大小。

1 回答 1