我想知道这些信息是从哪里来的。访问这些变量时,我真的是在访问寄存器还是其他地方?(我的猜测是这些是寄存器值。)
我想知道将它们存储在寄存器中是否有任何速度优势?
__global__ void myKernel(int, float, int*) {
const int reg1= threadIdx.y // gonna use/Rd reg1 some 50 different places
:
:
}
或者读取 threadIdx.y 大约 50 次是否一样快?