2

在 CUDA 视觉分析器版本 5 中,我知道“gld/st_requested_throughput”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我很困惑,因为有两对指标似乎是合格的,它们是“gld/st_throughput”和“dram_read/write_throughput”。哪一对实际上是硬件吞吐量?另一个是做什么的?

4

1 回答 1

1

gld/st_throughput包括由 L1 和 L2 缓存服务的事务。Whiledram_read/write_throughput是 L2 和设备内存之间的吞吐量。因此,每个全局内存访问都计入,gld/st_throughput但只有错过 L1 和 L2 缓存的请求才计入dram_read/write_throughput.

我在任何地方都没有找到对柜台的一个很好的概述。希望 NVIDIA 能提供...

于 2012-12-12T14:45:37.860 回答