我们刚刚收到了稳定版的 CUDA 5。有一些新的术语,如 Kepler 和使用性能更好的 MPI 的能力,以及同时运行同一张卡和 32 个应用程序的能力。我有点困惑,正在寻找这些问题的答案:
- 充分利用 CUDA 5 的功能需要哪些卡和计算能力?
- 新功能是否仅适用于 Kepler 架构,例如 GPUDirect、Dynamic Parallelism、Hyper Q 和 Dynamic Parallelism。
- 如果我们有 Fermi 架构,那么使用 CUDA 5 的好处是什么?除了在 Linux 和 Eclipse 上使用 NSight 的能力之外,它是否带来了其他好处。我认为最重要的功能是构建库的能力?
- 从 CUDA 4 到 CUDA 5,您是否看到任何性能改进?(我在 Linux 机器上得到了一些加速)
我发现了一些文件,比如
- http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/Kepler_Compatibility_Guide.pdf
- http://www.nvidia.com/content/PDF/kepler/NVIDIA-Kepler-GK110-Architecture-Whitepaper.pdf
- http://blog.cuvilib.com/2012/03/28/nvidia-cuda-kepler-vs-fermi-architecture/
然而,一个更好、更简短的描述可能会让我们的头脑更清晰。
PS:请不要将答案局限于上述问题。我可能会错过一些类似的问题。