1

我使用了以前版本的 Nvidia 分析器来分析 l1 和 l2 缓存命中率,但我不确定我使用的是哪个版本。似乎 cuda 4.2 视觉分析器没有 L1 和 L2 分析信息(全局缓存重播开销除外)。如何使用 cuda 4.2(或特定的先前版本)视觉/命令行分析器分析 L1 或 L2 缓存命中率?

4

1 回答 1

1

不确定您使用的是 windows 还是 linux,但对于 windows,您有 Parallel Nsight for MS Visual Studio(还有一个 eclipse 版本)。Nsight 允许您定义许多不同的“实验”。甚至您也可以使用“自定义”实验。如果您选择“内存”实验,它将包括所需的 L1 和 L2 缓存命中率。我附上一个截图显示Parallel Nsight 性能截图

这取自 NSight paralell 3.0,但它在以前的版本中也可用。

编辑:

使用可视化分析器(至少 5.0 版,但我猜以前的版本会相似)您可以设置您感兴趣的事件和指标,在 Visual Profiler 5.0 中,您可以点击运行 --> 配置指标和事件。在附加的窗口中,您可以设置您想要观看的任何计数器。可用的指标和事件将取决于底层硬件(即您的 GPU 具有的可访问计数器)。附上我 GTX 480 中一些内存计数器的图片 缓存事件 GTX 480 视觉分析器 5.0

编辑2: 好的,刚刚注意到您在编辑原始问题后要求使用Linux......所以对于Linux,我不知道NVidia是否提供了这样的Visual Profiler(我猜他们提供)。如果没有,您可能对 Eclipse NSight 版本感兴趣...

于 2013-03-19T08:12:51.020 回答