我正在使用 VS2005(在工作中)并且需要执行以下操作的 SSE 内在函数:
我有一个预先存在的__m128i
n填充 16 位整数a_1,a_2,....,a_8
。
由于我现在想做的一些计算需要 32 位而不是 16 位,所以我想从n中提取两个四组 16 位整数,并将它们放入两个分别__m128i
包含a_1,...,a_4
和的分隔 s 中a_5,...,a_8
。
我可以使用各种_mm_set
内在函数手动执行此操作,但这些会导致mov
汇编中的 8 个 s,我希望有一种更快的方法来执行此操作。