如上一篇文章所述: 如何找到 CUDA 中的最大可用线程数? 我发现我的 GPU 卡上的最大线程数是 21504。但是,当我为内核分配的线程数超过这个数时,一切运行顺利。
#include <stdio.h>
#include <cuda_runtime.h>
__global__ void dummy()
{
}
int main()
{
//int N=21504;
int N=21504*40;
dummy<<<1,N>>>();
return 0;
}
我不知道发生了什么,但我相信我们应该避免这种情况,并且不知道该怎么做。