4

我觉得需要速度。双 for 循环正在扼杀我的 iPad 应用程序性能。我需要 SIMD。如何在 iPad A4 处理器上执行整数 SIMD 操作?

谢谢,
道格

4

2 回答 2

5

指令集是NEON,内在函数参考

我从来没有找到关于它们实际上是什么的好的文档。但是如果你接触过 SSE,你会很快学会

于 2010-10-02T19:37:59.197 回答
4

为了获得最快的速度,您将不得不编写使用 NEON SIMD 操作的 ARM 汇编语言代码,因为 C 编译器通常不会生成非常好的 SIMD 代码,因此手写汇编会产生很大的不同。我在这里有一个简短的介绍:http: //www.shervinemami.co.cc/iphoneAssembly.html

请注意,iPad A4 使用 ARMv7-A CPU,因此 NEON SIMD 指令的参考手册位于:http: //infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (但它有 2000 页长,需要理解汇编代码,也许一般来说是 SIMD!)。

于 2010-11-01T15:30:17.393 回答