当我列出 nvprof 的指标时
nvprof --query-events
我懂了:
thread_inst_executed:活动线程执行的指令数。对于每条指令,它会增加执行该指令的线程数,包括断定线程数。它不包括重播。
我想使用这个指标,所以我使用以下方法收集指标:
nvprof --csv --metrics thread_inst_executed,inst_executed,inst_executed_global_loads,inst_executed_global_stores,inst_executed_local_loads,inst_executed_local_stores,inst_executed_shared_loads,inst_executed_shared_stores,gld_transactions,gst_transactions,local_load_transactions,local_store_transactions,shared_load_transactions,shared_store_transactions,l2_read_transactions,l2_write_transactions,dram_read_transactions,dram_write_transactions,sysmem_read_transactions,sysmem_write_transactions ./my_program my arguments
输出具有我要求的所有指标...除了thread_inst_executed
. 为什么它不见了?我怎么才能得到它?