Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我了解 Fermi GPU 支持预取到 L1 或 L2 缓存。但是,在 CUDA 参考手册中我找不到任何关于它的信息。
Dues CUDA 允许我的内核代码将特定数据预取到特定级别的缓存?
不是在指令级别,而是在此处有关 GPU 预取的详细信息:
GPGPU 应用程序的多线程感知预取机制 (2010 年 ACM 微架构研讨会上的论文)
您可以在 nVIDIA 的PTX ISA 参考文档中找到指令参考;相关说明是prefetch和prefetchu。
prefetch
prefetchu