0

我如何计算处理器的 GFlops:Intel Xeon E5-2670 v2 时钟速度:2.5 GHz vCPU:2 内存:7.5 GiB 存储:1 * 32 SSD 网络性能:中等(500 Mbps)

它的 aws 实例类型:m3.large 我无法找到 IPC 并计算 GFlops,因此我可以估算我的成本。任何帮助都会很棒。

4

1 回答 1

0

Xeon E5-xxxx v2 是 IvyBridge 内核,因此不支持 FMA。有关 IvyBridge 管道的详细信息,请参阅Agner Fog 的 microarch pdf

如果您设法避免任何内存瓶颈,IvB 可以维持每个时钟两个 AVX 矢量 FP 操作的吞吐量。执行端口 1 可以运行vmulpsor vaddps,但执行端口 0 只能运行vmulps

所以:2.5G 时钟/秒 * 2 个 FP 向量/时钟 * 8 个单精度元素/向量

因此:单精度 40GFlop/sec 理论最大值,使用 AVX 256b 向量。双精度:20GFlop/sec(每个 256b 向量 4 个 DP 元素)。

请注意,即使来自 L1 缓存,IvB 也只有 128b 加载/存储数据路径,并且对于 256b 向量,每 2 个时钟只能承受 2 个加载和 1 个存储。

mul 有 5c 延迟, add 有 3c 延迟,因此您需要足够的指令级并行度来一次保持 5 或 10 个乘法。

于 2016-04-08T15:09:41.583 回答