4

我正在尝试使用 gprof 命令:gprof -s executable.exe gmon.out gmon.sum合并从我的程序的 2 次运行中收集的分析数据。但是会出现以下错误:

gprof:在总共 196608 个字节后分配 3403207348 个字节的内存不足

我的程序很简单(只有一个for循环)。如果我运行一次,运行时间太短(显示 0.00 秒),gprof 无法记录。

在 CygWin 中,我执行以下步骤:

  1. gcc -pg -o fl forAndWhillLoop.c

  2. fl(运行程序)

  3. mv gmon.out gmon.sum

  4. fl(运行程序)

  5. gprof -s fl.exe gmon.out gmon.sum

  6. gprof fl.exe gmon.sum>gmon.out

  7. gprof fl.exe

我的程序:

int main(void)
{
    int fac=1;
    int count=10;
    int k;

    for(k=1;k<=count;k++)
    {
        fac = fac * k;
    }

    return 0;
}

那么有人可以帮我解决这个问题吗?谢谢!

4

2 回答 2

0

如果您只想计时,在我的机器上它是105ns。这是代码:

void forloop(void){ 
    int fac=1; 
    int count=10; 
    int k; 

    for(k=1;k<=count;k++) 
    { 
        fac = fac * k; 
    } 
} 

int main(int argc, char* argv[])
{
    int i;
    for (i = 0; i < 1000000000; i++){
        forloop();
    }
    return 0;
}

明白了吗?我用的是手持秒表。由于它运行 10^9 次,因此秒 = 纳秒。

像这样展开内部循环将时间减少到92ns

int k = 1;
while(k+5 <= count){
    fac *= k * (k+1) * (k+2) * (k+3) * (k+4);
    k += 5;
}
while(k <= count){
    fac *= k++;
}

从 Debug 切换到 Release 构建将其降低到21ns。您只能在实际热点中期望这种加速,就是这样。

于 2010-02-04T15:50:41.310 回答
0

似乎应该执行pprof而不是gprof

于 2018-09-05T20:24:02.633 回答