我尝试在 Xeon E5 和 Xeon Phi 上运行 1,000,000,000 次 for 循环,并测量时间来比较它们的功效,我很惊讶我得到了以下结果:
- 在 E5(1 线程)上:41.563 秒
- 在 E5(24 线程)上:22.788 秒
- Xeon Phi(240 线程)卸载:45.649 秒
谁能告诉我为什么我的疗效不好?关于建筑或任何其他?
为什么我在 Xeon Phi 上的效果不好?我对 for 循环什么都不做。如果我的 Xeon Phi 协处理器没有任何问题,那么 Xeon Phi 的哪些工作很棒?一定要矢量化?如果不是矢量化,我可以在 Xeon Phi 上做任何事情,使用它的线程来帮助我吗?