我有一个 CUDA 项目。它由几个包含我的应用程序逻辑的 .cpp 文件和一个包含多个内核以及一个__host__
调用它们的函数的 .cu 文件组成。
现在我想确定我的内核使用的寄存器数量。我的正常编译器调用如下所示:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
.
不幸的是,在此调用中添加“-Xptxas –v”编译器标志没有效果。编译器仍然产生与以前相同的文本输出。编译后的 .exe 的工作方式也与以前相同,但有一个例外:我的帧率从 80fps 跃升至 1800fps。