我试图弄清楚是否以及如何并行化特定的现有代码以在 ARM Cortex-A9 NEON SIMD 单元中使用。这是代码:
for(int i=0; i < 11; i++)
{
f4UF1 *= F[i];
A[i][2] = A[i][1];
A[i][1] = A[i][0];
A[i][0] = f4UF1;
B[i][2] = B[i][1];
B[i][1] = B[i][0];
C[i] = 0;
C[i] += D[i][0] * A[i][0];
C[i] += D[i][1] * A[i][1];
C[i] += D[i][2] * A[i][2];
C[i] -= E[i][1] * B[i][1];
C[i] -= E[i][2] * B[i][2];
B[i][0] = C[i] / E[i][0];
f4UF1 = B[i][0];
}
我已经看了很多代码,我几乎可以肯定它不能有效地并行化,但我想,我可以试试在这里问。我不期待准备好的代码,只是关于如何做的想法。谢谢 :)