只是为了看看 CUDA 生成什么样的代码,除了目标文件之外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要很长时间,我希望能够编译*.cu
→<code>*.ptx→<code>*.o而不是在*.cu
→<code>*.ptx和*.cu
→< code>*.o,我目前正在这样做。
只需添加-ptx
到该nvcc *.cu
行即可提供所需的 ptx 输出。
使用ptxas -c
编译*.ptx
可以*.o
工作,但在我的可执行链接中导致错误:Relocations in generic ELF (EM: 190)
.
尝试编译*.ptx
with静默nvcc
失败,不输出任何内容。
我需要传递一些选项ptxas
吗?我应该如何通过单独编译通过 ptx 正确编译?或者,我可以告诉nvcc
保留 ptx 吗?