假设我的 CUDA 内核有一长串参数。为方便起见,我将它们放在一个结构中:
struct params {
int firstParam;
float secondParam;
...
bool lastParam;
}
调用内核时是否有缺点
myKernel<<<n,m>>>( params );
与第一次复制到常量内存相比?
cudaMemcpyToSymbol( paramsOnDevice, ¶msOnHost, sizeof(params), 0 );