目前我正在尝试优化一些cuda内核......
如果使用选项--ptxas-options=-v 编译,我会得到有关寄存器%co 的信息。
就我而言,我总是得到一些额外的行,这对我来说毫无意义:
ptxas : info : Compiling entry function '_Z20backprojLinTexInterpP7double3S0_S0_P7double2iiiiiS2_PdPf' for 'sm_20'
ptxas : info : Function properties for _Z20backprojLinTexInterpP7double3S0_S0_P7double2iiiiiS2_PdPf
8 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas : info : Used 47 registers, 32 bytes smem, 112 bytes cmem[0], 56 bytes cmem[16]
ptxas : info : Function properties for __internal_trig_reduction_slowpathd
40 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
第 1 到 4 行对我来说很清楚,但最后一行是什么?
谷歌在这里没有帮助....我已经尝试过了。
有人知道这些行的含义是什么吗?我为程序中的每个编译内核获取它们