4

带有 CC 3.0 的 CUDA 的新 l1_shared_bank_conflict(或等效)计数器是什么?在 CUPTI 用户指南中,它说 shared_[load|store]_bank_conflict,但是当我尝试时它没有显示。

我在 Linux 中使用命令行分析器。

4

1 回答 1

3

旧的命令行分析器不支持一些新的计数器。如果你使用的是 CUDA 5,你可以试试 nvprof:

nvprof --events l1_shared_bank_conflict <app_name>

nvprof --query-events

请参阅http://docs.nvidia.com/cuda/profiler-users-guide/index.html#nvprof-overview

于 2012-12-24T19:33:32.530 回答