Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我当然知道nvvpand的存在nvprof,但是由于各种原因nvprof不想使用涉及大量共享库的应用程序。nvidia-smi可以挂钩驱动程序以找出正在运行的内容,但我找不到nvprof连接到正在运行的进程的好方法。
nvvp
nvprof
nvidia-smi
有一个标志--profile-all-processes实际上确实给了我一条消息“NVPROF 正在分析过程 12345”,但没有进一步打印出来。我正在使用 CUDA 8。
--profile-all-processes
在这种情况下,如何获得 CUDA 内核的详细性能细分?
正如评论所暗示的,您只需确保在要分析的进程之前启动 CUDA 分析器(现在是 NSight Systems 或 NSight Compute,不再是 nvprof) 。例如,您可以将其配置为在系统启动时运行。
您无法分析您的应用程序与它是一个“涉及大量共享库的应用程序”无关 - 分析工具可以很好地分析这些应用程序。