Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想在 NVIDIA GPU 上拦截 opencl 程序的 PTX 级别。
我想例程可能看起来像这样。
首先,我编写了一个 opencl 程序(主机和设备代码),使用 NVIDIA 编译器生成各自的 ptx 代码。然后我通过修改PTX代码来写我想做的事情(请不要问我为什么没有在设备C代码上这样做——我有一些原因)。但问题是,修改后,如何将这个 PTX 代码编译成二进制代码?
您可以使用 ptxas,它包含在 CUDA 工具包中。它将 .ptx 编译成 .cubin,然后可以使用驱动程序 API 加载。