1

我想在 NVIDIA GPU 上拦截 opencl 程序的 PTX 级别。

我想例程可能看起来像这样。

首先,我编写了一个 opencl 程序(主机和设备代码),使用 NVIDIA 编译器生成各自的 ptx 代码。然后我通过修改PTX代码来写我想做的事情(请不要问我为什么没有在设备C代码上这样做——我有一些原因)。但问题是,修改后,如何将这个 PTX 代码编译成二进制代码?

4

1 回答 1

1

您可以使用 ptxas,它包含在 CUDA 工具包中。它将 .ptx 编译成 .cubin,然后可以使用驱动程序 API 加载。

于 2012-07-10T03:41:38.827 回答