0

我正在尝试使用 SSE2 指令制作一些优化的代码。目前,我用内联汇编编写它,如下所示:

...
__m128 zero = {0};
__asm {
    ...
LINE_LOOP_1:
    MOVQ        xmm0, QWORD PTR [eax]    ; no problem
    PUNPCKLBW   xmm0, zero               ; PROBLEM IS HERE
    ...
    LOOP        LINE_LOOP_1
}

它工作得很好,但我想用内在函数重写它,这样更容易改变(我有稍微不同的计算版本,我想优化)。

但是,我无法弄清楚要使用哪些内在函数。我找到的任何文档都列出了大约一半的 SSE2 指令,看起来另一半不能作为内在函数使用!MS 似乎不太可能中途放弃 SSE 的实施。

那么,我可以使用哪个内在函数来生成PUNPCKLBW指令?

我使用 MS Visual Studio 2005。

PS 一些 MSDN文档建议使用_mm_unpacklo_pi8,但它不起作用:

#include "xmmintrin.h"

int main()
{
    __m128 x = {0}, y = {0};
    x = _mm_unpacklo_pi8(x, y);
}

这会产生编译错误:

错误 C2664:“_m_punpcklbw”:无法将参数 1 从“_m128”转换为“ _m64”

4

1 回答 1

2

你必须使用_mm_unpacklo_epi8 see here

后缀内部epi函数用于 SSE 寄存器,pi用于 MMX 寄存器。

于 2012-05-31T08:43:34.960 回答