3

我是 cuda 编程的新手。

我必须使用关于我的应用程序的 nvprof 进行 GPU 分析。

我找到了一个指标 l2_subp0_write_sector_misses,它表示从 L2 缓存的 slice 0 发送到 DRAM 的写请求数。

但我不知道切片是什么意思。

正如我猜测的那样,一个切片是一个 sm,因为 Gtx750 有 4 个 sm,并且事件中有 4 个切片(l2_subp0_write_sector_misses,l2_subp1_write_sector_misses,l2_subp2_write_sector_misses,l3_subp0_write_sector_misses)

但是,当我使用 1 个线程测试应用程序时,所有 write_misses 事件都有价值。

我认为如果一个切片是一个 sm,那么只有一个 write_misses 具有价值,而其他的都是 0。

什么是切片?

1个线程使用1个sm有错吗?

4

0 回答 0