0

谁能建议一种float使用 SSE4.1 之前的 SIMD 计算地板/天花板的快速方法?我需要正确处理所有极端情况,例如当我有一个float不能用 32 位 int 表示的值时。

目前我正在使用类似于以下代码(我使用 C 内在函数,为清楚起见转换为 asm):

;make many copies of the data
movaps       xmm0,   [float_value]
movaps       xmm1,   xmm0
movaps       xmm2,   xmm0

;check if the value is not too large in magnitude
andps        xmm1,   [exp_mask]
pcmpgtd      xmm1,   [max_exp]

;calculate the floor()
cvttps2dq    xmm3,   xmm2
psrld        xmm2,   31
psubd        xmm3,   xmm2
cvtsq2ps     xmm2,   xmm3

;combine the results
andps        xmm0,   xmm1
andnps       xmm1,   xmm2
orps         xmm0,   xmm1

有没有更有效的方法来检查浮点值是否对于 32 位 int 来说不是太大?

4

1 回答 1

0

以下是应直接转换为向量指令的单个元素的一些伪代码:

float f;
int i = (int)f; /* 0x80000000 if out of range (as from cvtps2dq) */
if (i == 0x80000000)
    return f;
else
    return (float)i;

您将int在第二行中使用您的舍入模式进行转换。您还可以测试IE标志MXCSR以检测超出范围的值。

于 2011-03-11T01:46:47.173 回答