我正在尝试使用 SSE2 指令制作一些优化的代码。目前,我用内联汇编编写它,如下所示:
...
__m128 zero = {0};
__asm {
...
LINE_LOOP_1:
MOVQ xmm0, QWORD PTR [eax] ; no problem
PUNPCKLBW xmm0, zero ; PROBLEM IS HERE
...
LOOP LINE_LOOP_1
}
它工作得很好,但我想用内在函数重写它,这样更容易改变(我有稍微不同的计算版本,我想优化)。
但是,我无法弄清楚要使用哪些内在函数。我找到的任何文档都列出了大约一半的 SSE2 指令,看起来另一半不能作为内在函数使用!MS 似乎不太可能中途放弃 SSE 的实施。
那么,我可以使用哪个内在函数来生成PUNPCKLBW
指令?
我使用 MS Visual Studio 2005。
PS 一些 MSDN文档建议使用_mm_unpacklo_pi8
,但它不起作用:
#include "xmmintrin.h"
int main()
{
__m128 x = {0}, y = {0};
x = _mm_unpacklo_pi8(x, y);
}
这会产生编译错误:
错误 C2664:“_m_punpcklbw”:无法将参数 1 从“_m128”转换为“ _m64”