0

当(动态)将 CUDA 代码编译为 PTX 时,您可以传递--generate-line-info命令行参数,并在您的 PTX 中获取一堆.loc条目,这些条目将 PTX 位置与源文件位置相关联。

clBuildProgram在 NVIDIA 平台上将OpenCL 代码编译为 PTX ( ) 时是否也可以使用类似的东西?

4

1 回答 1

1

试试-nv-line-info。我找不到它的文档,但编译器接受它并准确生成您正在寻找的内容。值得注意的是,他们的 官方 OpenCL 编译器选项扩展中没有该选项。

注意:您的里程可能会有所不同。几年前,当我摆弄这个时,与 CUDA + 相比,映射精度并不高nvcc。也许他们已经改进了一些事情。

于 2021-07-14T19:04:17.017 回答