这与 ARM Neon SIMD 编码特别相关。我正在为视频解码器中的某些模块使用 ARM Neon instrinsics。我有一个矢量化数据如下:
Neon 寄存器中有四个 32 位元素 - 例如 Q0 - 大小为 128 位。
3B 3A 1B 1A
在其他 Neon 寄存器中还有另外四个 32 位元素,例如 Q1,其大小为 128 位。
3D 3C 1D 1C
我希望最终数据有序,如下所示:
1D 1C 1B 1A
3D 3C 3B 3A
什么 Neon instrinsics 可以实现所需的数据顺序?