0

在 ipad1 和 ipad2 上测试 NEON 指令时,我注意到 ipad2 上的代码几乎没有任何加速,其中大多数功能实际上在 ipad2 上的运行速度比在 ipad1 上快得多。

这适用于 VMUL、VLD1、VADD 和 VSUB 等指令,它们使用 q0 等四字寄存器进行 FFT 等操作。

此外,我注意到苹果自己的 FFT 函数 vdsp_fft_zrip 也没有为 ipad2 加速。

所以问题是,对于四字 SIMD 类型的指令,ipad2 NEON 的执行速度是否比 ipad1 NEON 引擎快?

4

2 回答 2

1

与核心的其他部分相比,A4 上的 NEON 单元非常强大。A5 上的其余核心比 A4 有了很大改进,但 NEON 单元的性能或多或少没有变化。您正在观察的内容是预期的。

当然,现在有两个核心,所以如果你能同时利用它们,你仍然可以看到显着的加速。此外,A5 上的双精度计算比 A4 有了很大改进,因为它现在是完全流水线的。

于 2011-11-04T13:14:10.190 回答
0

NEON 将在很长一段时间内保持不变,即使在最近推出的 64 位 ARM 上也是如此。

NEON 并没有从提高时钟速度中受益。NEON 已经如此之快,以至于它花费了大部分函数执行时间来等待内存中的数据。

于 2011-11-02T11:46:22.413 回答