Desktop i7-4770k @ 4GHz 的内核峰值 GFLOPS 为 4GHz * 8 (AVX) * (4 FMA) * 4 cores = 512 GFLOPS。但最新的英特尔 IGP(Iris Pro 5100/5200)峰值超过800 GFLOPS。因此,一些算法将在 IGP 上运行得更快。将内核与 IGP 结合在一起会更好。此外,IGP 不断消耗更多的硅。Iris Pro 5100 现在占据了 30% 以上的硅片。英特尔台式机处理器的发展方向似乎很清楚。
然而,据我所见,英特尔 IGP 大多被程序员忽略,但 OpenCL/OpenGL 除外。我很想知道如何在没有 OpenCL 的情况下对 Intel HD Graphics 硬件进行编程以进行计算(例如 SGEMM)?
添加了评论: 它们不支持英特尔在 Linux 上的高清显卡和 OpenCL。我发现beignet是开源的,它至少为 Ivy Bridge HD 图形添加了对 Linux 的支持。我还没有尝试过。那时可能开发 Beignet 的人知道如何在没有 OpenCL 的情况下对高清图形硬件进行编程。