for (n = 0; n < L_SUBFR; n++)
{
s = 0;
for (i = 0; i <= n; i++)
{
s += exc[i] * h1[n - i];
}
y1[n] = s;
}
优化版:
for (n = L_SUBFR; n != 0; n--)
{
for (i = n; i != 0; i--)
{
y1[n] = y1[n] + exc[i] * h1[n - i];
}
}
AMD opteron 6274
编译后我已经在位机上运行了这两个代码,gcc 4.4.6.
但是,我看不到速度或执行时间的任何增益。
(1) 有什么办法可以进一步优化上述代码?
(2) 谁能告诉我为什么我看不到收益?