1

在 Parallel Nsight 中单步执行内联 PTX 时是否可以查看 PTX 寄存器?

我可以在内联 PTX 上设置断点并单步执行,但将鼠标悬停在 PTX 寄存器上不会显示它们的值。我可以打开 SASS 并将鼠标悬停在这些寄存器上确实会显示它们的值,但是很难跟踪 PTX 寄存器和 SASS 寄存器之间的关系。

4

1 回答 1

2

不幸的是,GPU 不能直接执行 PTX,它只能执行 SASS 微码。因为驱动程序中的 JIT 编译器(翻译 PTX->SASS)确实可以在编译期间自由地实质性地更改 PTX 代码,执行优化,例如消除公共子表达式,您的观察结果是 1)“很难跟踪关系PTX 寄存器和 SASS 寄存器之间”和 2)在执行期间不能检查 PTX 寄存器都太准确了。

我预计这些限制中的任何一个都不会在可预见的将来消除。

于 2012-04-06T02:18:25.857 回答