1

我需要最小化以下代码中的失败总数,任何人都可以快速查看并告诉我在哪里努力?我尝试了几种性能分析仪,但结果无关紧要..

int twoDToOneD(int i, int j, int nRows)
{
return j*nRows + i;
}

double* addMatrices(int m, int n, double* A, double* B, bool add)
{
double* C = new double[m*n];
double* pA = A;
double* pB = B;
double* pC = C;

int i = m*n;

while(i--)
{
    if(add)
    {
        *pC = *pA + *pB;
    } else 
    {
        *pC = *pA - *pB;
    }

    pC++;
    pA++;
    pB++;
}

return C;
}

谢谢,赵

4

1 回答 1

0

是的,我没有阅读最后一行,但看起来你很简单:

  1. 生成随机整数
  2. 将它们存储为doubles
  3. 添加它们
  4. 相加和相乘

IOW - 我根本看不到分数任何用途,适当大小的整数会更好。如果这是真的,您可以删除程序中的每个 FLOP ;)

如果这不是一个准确的信号,您仍然可以在适当的范围内使用它,然后将信号放大,存储为整数,然后在某些情况下将结果降低到适当的范围。

对于适当大小的 mul/add,使用整数会更快,并且可能需要更少的内存——您也可以对它们应用 SIMD 指令。

除此之外 - 您改进缓存局部性、最小化分支和最小化动态分配也可以使程序快几倍。

于 2012-02-27T11:58:07.477 回答