在 ipad1 和 ipad2 上测试 NEON 指令时,我注意到 ipad2 上的代码几乎没有任何加速,其中大多数功能实际上在 ipad2 上的运行速度比在 ipad1 上快得多。
这适用于 VMUL、VLD1、VADD 和 VSUB 等指令,它们使用 q0 等四字寄存器进行 FFT 等操作。
此外,我注意到苹果自己的 FFT 函数 vdsp_fft_zrip 也没有为 ipad2 加速。
所以问题是,对于四字 SIMD 类型的指令,ipad2 NEON 的执行速度是否比 ipad1 NEON 引擎快?