我的设置环境:CUDA 10.2 设备:RTX 2080 操作系统:Ubuntu 16.04 当我尝试使用 nvprof 时,我发现它不支持计算能力为 7.2 或更高的设备。建议我改用 Nsight Compute 或 Nsight Systems。但是由于缺少图形界面,我无法启动上述两个软件。如何在远程服务器中使用 Nsight Compute?顺便问一下,是否可以在 Nsight Compute 中分析指标?
1 回答
如何在具有计算能力 7.x 的 CUDA 应用程序中进行分析?
对于计算能力 7.5 及更高版本,推荐的工具是 nsight 计算和 nsight 系统。nsight 计算的文档在这里,nsight 系统的文档在这里。这里有一个介绍性博客描述这些“新”CUDA 分析器工具,这里有一个关于 nsight 系统的教程博客和一个关于 nsight 计算的教程博客。介绍性博客描述了为什么有 2 个工具,以及它们如何相互关联。
度量标准“dram_read_throughput”在 Nsight Compute 中有效吗?
它不是。该指标的命名格式表明它是一个 nvprof 指标。nvprof 指标名称通常不能直接在 Nsight Compute 中使用。要了解 nsight 计算中是否存在针对给定 nvprof 指标的“等效”指标,请使用nvprof 转换指南,尤其是指标比较表。通过研究该表,您会注意到有一个 Nsight 计算指标等效于dram_read_throughput
,它被命名为有关如何在 nsight 计算中捕获此指标的说明,请参阅我在这里dram__bytes_read.sum.per_second
已经提到的博客,或参考文档在这里。
但是由于缺少图形界面,我无法启动上述两个软件。如何在远程服务器中使用 Nsight Compute?
如果您在远程服务器上安装了 CUDA 工具包,您应该能够在 CLI(命令行界面)模式下运行 Nsight Compute。这在已经链接的文档和已经链接的博客文章中都有描述。或者,您可以在远程模式下运行 GUI,如此处所述。
顺便问一下,是否可以在 Nsight Compute 中分析指标?
是的,我们已经介绍过了。
我将无法使用此问题/答案来调试远程连接详细信息或有关 Nsight 工具的特定访问案例或使用场景的任何其他后续问题。已经有可用的文档和教程。如果您还有其他具体问题,请提出新问题。要查找 Nsight Compute 和 Nsight Systems 的资源,我建议只需在谷歌上搜索这些名称。通常,第一个点击将是链接到上述所有资源的登录页面,以及其他资源,例如描述特定案例和高级用法的视频教程。