我有以下 for 循环。当我打开类型数组时,代码不会矢量化。当我将类型固定为“1”时,gcc 会执行一个 primitize 矢量化矢量化。有没有人有任何建议来触发某种矢量化?
#define type(M,N) type[(M)*sizeX + (N)]
for (int i = 0; i < sizeY - 1; i++)
{
for (int j = 0; j < sizeX - 1; j++)
{
const int id = type(i, j);
//const int id = 1; //vectorizes
const float A = this->A[id];
const float B = this->B[id];
a(i, j) = A * a(i, j) + B * (b(i, j) - b(i + 1, j))*(p[i]);
}
}
gcc 4.7.1 的近似错误
45: not vectorized: not suitable for gather A_26 = *D.14145_25;
编辑 1
所有数组都存储为指针,并使用restrict关键字定义为某个类的成员。
编辑 2
type
如果 ' ' 很小,我能做些什么吗?
编辑 3
小意味着 8。