只是为了看看 CUDA 生成什么样的代码,除了目标文件之外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要很长时间,我希望能够编译*.cu→<code>*.ptx→<code>*.o而不是在*.cu→<code>*.ptx和*.cu→< code>*.o,我目前正在这样做。
只需添加-ptx到该nvcc *.cu行即可提供所需的 ptx 输出。
使用ptxas -c编译*.ptx可以*.o工作,但在我的可执行链接中导致错误:Relocations in generic ELF (EM: 190).
尝试编译*.ptxwith静默nvcc失败,不输出任何内容。
我需要传递一些选项ptxas吗?我应该如何通过单独编译通过 ptx 正确编译?或者,我可以告诉nvcc保留 ptx 吗?