我在我的代码中使用这种类型的样条曲线,我想知道该算法是否可以从使用 SIMD 指令中受益。(ARM 上的 NEON)使用的代码是以下源代码的 C 翻译(在 Fortran 中):
- http://pages.cs.wisc.edu/~deboor/pgs/chol1d.f(最消耗CPU的过程)
- http://pages.cs.wisc.edu/~deboor/pgs/setupq.f(设置过程)
- http://pages.cs.wisc.edu/~deboor/pgs/smooth.f(调用上述程序的主函数)
根据您的经验,您能否判断此代码是否有机会通过使用 SIMD 指令进行优化?
是否有使用 SIMD 指令将代码从“普通”代码转换为代码的指南?
谢谢