5

从值我们可以推断它使用与双精度浮点硬件相同的组件。但是 double 有 53 位有效位,那么为什么 AVX512-IFMA 限制为 52 位呢?当然尾数只有 52 位,并且隐藏了一位,但它仍然对值有贡献,需要输入加法器/乘法器/除法器...

4

2 回答 2

4

IEEE-754 双精度实际上只有 52 个显式存储位,第 53 位(最高有效位)是隐式 1。

于 2015-03-04T19:26:09.680 回答
0

它利用DPF算术单元和FMA实现快速多精度乘法,详见本文第一节: Faster Modular Exponentiation Using Double Precision Floating Point Arithmetic on GPU

由于它在论文中介绍的dpf乘法单元上进行乘法运算,如果操作数以53位采样,则会破坏统一的处理步骤。

于 2020-11-05T03:28:24.443 回答