虽然您通常在 CPU 上获得比浮点性能更好的整数运算性能,但有人可以澄清 SIMD 版本的情况。例如:
__m128i _mm_mul_epi32(__m128i a, __m128i b);
//(multiplies 2 integer vectors)
相对:
__m128 _mm_mul_ps(__m128 a , __m128 b );
//(multiplies 2 float vectors)
哪个产生更高的性能?(假设机器具有 SSE4 功能)。我这么说是因为我根据 SSE2 指令编写了自己的小数学库,我不知道我是否应该继续使用 __m128i。