3

我当然知道nvvpand的存在nvprof,但是由于各种原因nvprof不想使用涉及大量共享库的应用程序。nvidia-smi可以挂钩驱动程序以找出正在运行的内容,但我找不到nvprof连接到正在运行的进程的好方法。

有一个标志--profile-all-processes实际上确实给了我一条消息“NVPROF 正在分析过程 12345”,但没有进一步打印出来。我正在使用 CUDA 8。

在这种情况下,如何获得 CUDA 内核的详细性能细分?

4

1 回答 1

1

正如评论所暗示的,您只需确保在要分析的进程之前启动 CUDA 分析器(现在是 NSight Systems 或 NSight Compute,不再是 nvprof) 。例如,您可以将其配置为在系统启动时运行。

您无法分析您的应用程序与它是一个“涉及大量共享库的应用程序”无关 - 分析工具可以很好地分析这些应用程序。

于 2021-02-02T00:03:42.383 回答