c - _mm256_slli_si256：错误“最后一个参数必须是 8 位中间值”

Question

我有以下问题（g++（Ubuntu 4.8.4-2ubuntu1~14.04）4.8.4）：

当我_mm256_slli_si256()直接使用时，如：

__m256i x = _mm256_set1_epi8(0xff);
x = _mm256_slli_si256(x, 3);

代码编译没有问题（g++ -Wall -march=native -O3 -o shifttest shifttest.C）。

但是，如果我将它包装成一个函数

__m256i doit(__m256i x, const int imm)
{
  return _mm256_slli_si256(x, imm);
}

编译器抱怨说

/usr/lib/gcc/x86_64-linux-gnu/4.8/include/avx2intrin.h: In function '__m256i doit(__m256i, int)':
/usr/lib/gcc/x86_64-linux-gnu/4.8/include/avx2intrin.h:651:58: error: the last argument must be an 8-bit immediate
   return (__m256i)__builtin_ia32_pslldqi256 (__A, __N * 8);

无论是否使用该功能。

这对于直接操作数来说不是问题，因为如果我使用 eg_mm256_slli_si32(x, imm)代替，函数 doit() 会编译，并且_mm256_slli_si32()还需要立即操作数。

有一个相关的错误报告

https://gcc.gnu.org/bugzilla/show_bug.cgi?format=multiple&id=54825

但它已经很老了（2012 年）并且与 gcc 4.8.0 相关，所以我认为该补丁已经被合并到 g++ 4.8.4 中。

有解决此问题的方法吗？

score 10 · Accepted Answer

指示要移位的位数的参数必须是编译时常量，因为它在指令中被编码为立即值（即不从寄存器加载；实际移位值是指令编码的一部分）。只要你直接使用它，像这样：

__m256i x = _mm256_set1_epi8(0xff);
x = _mm256_slli_si256(x, 3);

然后编译器将移位值视为编译时常量 3。但是，在包装函数的上下文中：

__m256i doit(__m256i x, const int imm)
{
  return _mm256_slli_si256(x, imm);
}

编译器无法imm在编译时推断的值，这是合成移位指令所必需的。imm是 a的事实const int并不意味着它的值在编译时是已知的，只是语言的语义不允许在doit()函数范围内对其进行修改。

如果doit()要由编译器内联，那么它可能能够静态确定的值imm并因此编译成功，但这可能太过分了。

如果您使用的是 C++，另一种选择是制作doit()一个带有指示移位大小的参数的函数模板，如下所示：

template <int Shift>
__m256i doit(__m256i x)
{
  return _mm256_slli_si256(x, Shift);
}

score 1 · Accepted Answer

问题是由于您的函数是公共的（即可由其他 C/C++ 模块中的函数调用）。如果将其声明为static(or inline)，编译器将不会为该函数生成代码，并且不会出现错误。

c - _mm256_slli_si256：错误“最后一个参数必须是 8 位中间值”

2 回答 2

Related

Reference