0

当我列出 nvprof 的指标时

nvprof --query-events

我懂了:

thread_inst_executed:活动线程执行的指令数。对于每条指令,它会增加执行该指令的线程数,包括断定线程数。它不包括重播。

我想使用这个指标,所以我使用以下方法收集指标:

nvprof --csv --metrics thread_inst_executed,inst_executed,inst_executed_global_loads,inst_executed_global_stores,inst_executed_local_loads,inst_executed_local_stores,inst_executed_shared_loads,inst_executed_shared_stores,gld_transactions,gst_transactions,local_load_transactions,local_store_transactions,shared_load_transactions,shared_store_transactions,l2_read_transactions,l2_write_transactions,dram_read_transactions,dram_write_transactions,sysmem_read_transactions,sysmem_write_transactions ./my_program my arguments

输出具有我要求的所有指标...除了thread_inst_executed. 为什么它不见了?我怎么才能得到它?

4

1 回答 1

2

当我列出 nvprof 的指标

nvprof --query-事件

这不是一致的用法(强调添加)。

使用nvprof(或nvvp),事件指标不是一回事

要查询事件,您将使用:

--query-events

要查询指标,您将使用:

--query-metrics

要分析,要求事件测量,您将使用

--events name_of_event,...

要配置文件,要求进行公制测量,您可以使用

--metrics name_of_metric,...

如果你做这样的事情:

--metrics name_of_event,...

或者

--events name_of_metric,...

我不知道这种行为是什么,但我不希望它能够正常工作。

于 2020-07-31T15:54:27.283 回答