5
float a[4] = {1,2,3,4}, b[4] = {4,3,2,1};
uint32_t c[4];

int main() {

    __m128 pa = _mm_loadu_ps(a);

    __m128 pb = _mm_loadu_ps(b);
    __m128 pc = _mm_cmpgt_ps(pa, pb);
    _mm_storeu_ps((float*)c, pc);
    for (int i = 0;i  < 4; ++i) printf("%u\n", c[i]);
    return 0;
}

什么是正确的指令_mm_storeu_ps((float*)c, pc)?在这里,c 是一个整数数组……我觉得这种方式不好,更好吗?

4

1 回答 1

7

在 SSE2中有两条指令将__m128( floatvector) 转换为__m128i( vector):(带舍入)和(带截断)。int32_t_mm_cvtps_epi32_mm_cvttps_epi32

__m128i vi = _mm_cvttps_epi32(pc);
_mm_storeu_si128((__m128i *)c, vi);

如果你不能使用 SSE2,你应该在存储到数组后将float数组转换为数组。intpcfloat

float d[4];
_mm_storeu_ps(d, pc);
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];
于 2012-12-27T08:10:20.217 回答