0

在英特尔至强融核中,每个内核有 32 个 512 位宽的向量寄存器。每个向量寄存器每个周期可以进行 16 次单精度浮点运算。并且可以在 1 个周期内完成 2 个操作(1 个在 v-pipe 中,1 个在 u-pipe 中)。

我想知道除了在向量寄存器中完成的向量乘法之外,在 1 个时钟周期内可以完成多少次标量乘法。

4

1 回答 1

1

那里有一些误解。每个核心有 1 个矢量单元。寄存器存储值,它们不计算。因此,您可以在每个内核的每个周期发出 1 512 字节宽的向量操作。您也可以在 1 个周期内进行标量乘法。您不能同时发行两者。使用 u&v 管道,您可以发出一个向量或标量操作,然后在另一个管道中执行内存操作。您也可以在每个周期执行一个融合乘加 (MADD) 指令,这有效地为每个内核每个周期提供 2 个向量操作。

于 2013-10-12T00:29:50.807 回答