我正在android上编写一个图像处理应用程序,我正在尝试使用NDK加速它。我有以下for循环:
int x, y, c, idx;
const int pitch3 = pitch * 3;
float adj, result;
...
// px, py, u, u_bar are all float arrays of size nx*ny*3
// theta, tau, denom are float constants
// idx >= pitch3
for(y=1;y<ny;++y)
{
for(x=1;x<nx;++x)
{
for(c=0;c<3;++c)
{
adj = -px[idx] - py[idx] + px[idx - 3] + py[idx - pitch3];
result = ((u[idx] - tau * adj) + tau * f[idx]) * denom;
u_bar[idx] = result + theta * (result - u[idx]);
u[idx] = result;
++idx;
}
}
}
我想知道是否可以加快这个循环?
我认为使用定点算术不会有太大作用,除非在非常旧的 android 手机上(我不打算针对它)。在汇编中编写它会带来很大的改进吗?
编辑:我知道我可以使用 SIMD/NEON 指令,但我认为它们并不常见......