8

我了解 Fermi GPU 支持预取到 L1 或 L2 缓存。但是,在 CUDA 参考手册中我找不到任何关于它的信息。

Dues CUDA 允许我的内核代码将特定数据预取到特定级别的缓存?

4

1 回答 1

6

不是在指令级别,而是在此处有关 GPU 预取的详细信息:

GPGPU 应用程序的多线程感知预取机制
(2010 年 ACM 微架构研讨会上的论文)

您可以在 nVIDIA 的PTX ISA 参考文档中找到指令参考;相关说明是prefetchprefetchu

于 2011-02-09T21:10:11.397 回答