cuda - 使用 Nvidia 平台为 OpenCL 配置本地（共享）内存

Question

我想在我的 OpenCL 内核中优化我的本地内存访问模式。我在某处阅读了有关可配置本地内存的信息。例如，我们应该能够配置用于本地内存的数量以及用于自动缓存的数量。

我还读到这里可以为最新的（Kepler）Nvidia 硬件选择存储库大小： http ://www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus 。这一点对于在本地内存中存储双精度值似乎非常关键。

Nvidia 是否提供专门为 CUDA 用户设置本地内存的功能？我找不到类似的 OpenCL 方法。那么这可能以不同的方式调用还是真的不存在？

score 5 · Accepted Answer

不幸的是，使用 OpenCL 时无法控制 L1 缓存/本地内存配置。此功能仅由 CUDA 运行时提供（通过cudaDeviceSetCacheConfig或cudaFuncSetCacheConfig）。

1 回答 1