0

正如前一篇文章和 wiki 所说,“ivy bridge 可以做”8 DP FLOPs/cycle:4-wide AVX add + 4-wide AVX multiplication”我在这里有点困惑,我知道 ivy bridge 没有 FMA ,而AVX指令集可以做4个DP/cycle,那为什么要4个加法+4个乘法呢?

4

0 回答 0