1

我在谷歌上搜索并发现了这篇关于测量图形处理单元缓存上的各种数据的论文。这篇论文有这个读取延迟与数组大小的关系图,看起来像一个阶梯函数。

在此处输入图像描述

显然,从这张图中,我们可以看出缓存大小是 2048B(步骤开始的地方),行大小是单个步骤的宽度,“路大小”(不管是什么)是整个宽度步骤部分(2560B - 2048B)。

这真的很简洁,并且可以方便地确定缓存的结构,我认为通常不会为 GPU 记录这些结构。但是,我想知道这些解释来自哪里。他们背后的理由/逻辑是什么?

4

0 回答 0