7

在此处理器比较中,我能够找到 Xeon E5-2690 的理论 DP 峰值性能 371 GFlop/s (有趣的是,在英特尔的竞争对手中找到此信息比在英特尔支持页面本身更容易)。但是,当我尝试推导该峰值性能时,我的推导不匹配:

  1. Xeon E5-2690 的每个核心的频率(在 Turbo 模式下)= 3.8Ghz
  2. 处理器可以在每个周期执行一次addmul操作,因此我们得到:3.8 x 2 = 7.6
  3. 鉴于它支持 AVX,它每个周期可以执行 4 次双重操作:7.6 x 4 = 30.4
  4. 最后,它有 8 个内核,因此我们得到:8 x 30.4 = 243.2

因此,Gflop/s 的峰值性能将是 243.2 GFlop/s 而不是 371 GFlop/s?

4

1 回答 1

7

Turbo Mode不用于计算Theoretical Peak Performance,您必须考虑以下内容:

CPU 速度 = 2.9 GHz

CPU 内核 = 8

每个周期的 CPU 指令 = 8(考虑 AVX-256 -> 256 位单元,可以保存 8 个单精度值)x 2(如您所说的 add 和 mul 操作)= 16

放在一起:

2.9x8x16 = 371 GFlops/s

于 2013-12-05T13:16:16.423 回答