当(动态)将 CUDA 代码编译为 PTX 时,您可以传递--generate-line-info
命令行参数,并在您的 PTX 中获取一堆.loc
条目,这些条目将 PTX 位置与源文件位置相关联。
clBuildProgram
在 NVIDIA 平台上将OpenCL 代码编译为 PTX ( ) 时是否也可以使用类似的东西?
当(动态)将 CUDA 代码编译为 PTX 时,您可以传递--generate-line-info
命令行参数,并在您的 PTX 中获取一堆.loc
条目,这些条目将 PTX 位置与源文件位置相关联。
clBuildProgram
在 NVIDIA 平台上将OpenCL 代码编译为 PTX ( ) 时是否也可以使用类似的东西?
试试-nv-line-info
。我找不到它的文档,但编译器接受它并准确生成您正在寻找的内容。值得注意的是,他们的 官方 OpenCL 编译器选项扩展中没有该选项。
注意:您的里程可能会有所不同。几年前,当我摆弄这个时,与 CUDA + 相比,映射精度并不高nvcc
。也许他们已经改进了一些事情。