嘿,当我编译时,nvcc -arch=sm_13
我得到:
ptxas info : Used 29 registers, 28+16 bytes smem, 7200 bytes cmem[0], 8 bytes cmem[1]
当我使用时,nvcc -arch=sm_20
我得到:
ptxas info : Used 34 registers, 60 bytes cmem[0], 7200 bytes cmem[2], 4 bytes cmem[16]
我以为所有内核参数都传递到共享内存,但对于 sm_20,似乎不是这样......?!也许它们也被传递到寄存器中?我的函数的头部如下所示:
__global__ void func(double *, double , double, int)
到目前为止感谢!