我可以找到 CPU 内核与其缓存、主内存等之间的 ns 或 CPU 周期的延迟。
但似乎很难找到关于现代 GPU 的类似信息。
有谁知道 GPU 的延迟,尤其是现代 nvidia GPU(GF110 或更高版本)与其内存之间的延迟,谢谢。
GPU 内存确实有更大的带宽,但是它们的延迟呢?
听说GPU的延迟和CPU的延迟一样高,所以基本上让更大的带宽对于许多通用计算任务基本上没有意义,我只需要确认这一点。
由于供应商没有透露所有架构细节,研究人员使用逆向工程来揭开 GPU 架构的神秘面纱。请参阅这篇论文Demystifying GPU microarchitecture through microbenchmarking和其他引用此论文的论文(请注意,这不是我的论文)。我在下图中复制了他们的发现。