我真的不确定这是否是正确的地方。我对不同类型硬件的不同编程模型感兴趣。
开始是这样的,我展示了我正在使用 NVIDIA CUDA 做的一些工作。我告诉人们,使用 GPU 作为协处理器的主要问题之一是您必须在主机和 GPU 之间传输数据。然后有几个人继续向我询问有关 AMD“APU”的问题,以及图形核心与普通 CPU 核心在同一个芯片上的事实。
我通过指出 Intel/AMD CPU+GPU 芯片永远不会包含与专用 NVIDIA 卡一样多的图形内核来回避这些问题。
问题是,我真的不知道 AMD APU 或 Intel Sandy/Ivy Bridge 芯片的编程模型是什么。
我的问题是:
- 如何编写程序以利用 AMD/Intel 芯片上的图形内核?
- 这些图形核心真的可以直接访问主机内存吗?
- 有没有关于这些芯片在 SP 和 DP FLOPS 中的性能类型的任何信息?
- 来自 CUDA,在 NVIDIA GPU 和其他相关芯片的编程之间可以找到哪些相似之处?
- Cell 处理器的 SPE 是如何访问内存的,或者它的编程模型与今天的这些 Intel/AMD 芯片相比如何?