我知道如何从 a 生成.ptx
文件.cu
以及如何从 a 生成.cubin
文件.ptx.
但我不知道如何获得最终的可执行文件。
更具体地说,我有一个sample.cu
文件,它被编译为sample.ptx
. 然后我使用 nvcc 编译sample.ptx
为sample.cubin
. 但是,.cubin
如果没有主机代码,则无法直接执行此文件。如何将.cubin
文件链接到我的原始.cu
文件以生成最终的可执行文件?
您应该能够使用 cuModuleLoadDataEx 直接从 cuda 驱动程序 api 运行 ptx 代码。第5页有一个例子
从 CUDA 4.0 开始,您可以在 CUDA 内核中编写内联 PTX。