2

我知道如何从 a 生成.ptx文件.cu以及如何从 a 生成.cubin文件.ptx.但我不知道如何获得最终的可执行文件。

更具体地说,我有一个sample.cu文件,它被编译为sample.ptx. 然后我使用 nvcc 编译sample.ptxsample.cubin. 但是,.cubin如果没有主机代码,则无法直接执行此文件。如何将.cubin文件链接到我的原始.cu文件以生成最终的可执行文件?

4

2 回答 2

2

您应该能够使用 cuModuleLoadDataEx 直接从 cuda 驱动程序 api 运行 ptx 代码。第5页有一个例子

于 2011-02-21T11:16:50.167 回答
2

从 CUDA 4.0 开始,您可以在 CUDA 内核中编写内联 PTX。

于 2012-03-31T02:03:42.337 回答