令我惊讶的是,我找不到使用开源 OpenCL 基准套件(例如rodinia和SHOC )的这些产品的比较。这样的比较可能比理论峰值性能的比较或简单矩阵乘法内核的性能比较更有趣,我已经找到了。
有谁知道在哪里可以获得这样的结果?如果做不到这一点,是否有任何堆栈溢出用户可以访问一种或两种产品,以及运行基准测试和共享结果的时间和倾向?任何一张卡的任何版本的结果都会很有趣。
CLBenchmark.com 现在有一些Xeon Phi的结果,以及K20c的完整集。
这是 Xeon Phi 与 GTX Titan 的比较。
http://clbenchmark.com/compare.jsp?config_0=14470292&config_1=15887974
Xeon Phi 基本上在 10/12 基准测试中完全被破坏,并且与其他 2 个相当。因此,300 瓦 22 纳米 Phi 部分与 250 瓦 28 纳米 GPU 相比并不好。
基本上,Phi 似乎在利用其带宽容量时遇到了重大问题,矢量化代码似乎是另一个问题。
这是比较稀疏矩阵乘法性能的基准:
http://uk.arxiv.org/abs/1302.1078
它部分回答了我的问题,但我宁愿看到不止一种算法,而且我想看看 OpenCL 的可移植性如何,我仍然会接受任何可以提供该信息的答案。
Xeon Phi 的 SHOC 基准测试套件位于 github 上:
大量的基准测试帖子开始公开和“谷歌搜索”,但这里是关于 Xeon Phi 与双插槽 E5-2670 基准测试的标准英特尔通信:
在将 Xeon Phi 的性能与常规 Xeon 或任何其他平台进行比较时,请确保您考虑了平台的功率包络(双插槽 Xeon)以及应用程序是否已经针对 Xeon 进行了调整。Xeon Phi 的一大卖点是,除了 Xeon Phi 改进之外,您通常还会获得 Xeon 改进。蛮甜的。。