我有一个使用 Intel 内在函数的 C 应用程序,例如:
__m128 _mm_add_ps (__m128 a, __m128 b)
__m128 _mm_sub_ps (__m128 a, __m128 b)
__m128 _mm_mul_ps (__m128 a, __m128 b)
__m128 _mm_set_ps (float e3, float e2, float e1, float e0)
void _mm_store_ps (float* mem_addr, __m128 a)
__m128 _mm_load_ps (float const* mem_addr)
现在,我正在尝试修改我的应用程序,以便使用名为Gem5的模拟器使其在 ARMv8 上运行。因此,我开始四处寻找 ARM 内在函数,并找到了这本手册ARM® NEON™ Intrinsics Reference
好吧,我找到了算术内在函数,但我对设置、存储和加载指令有点迷茫。
任何有 ARM 内在函数经验的人都可以告诉我正确的内在函数吗?