5

我想使用valgrind来分析我的代码。问题是,我有一个我不感兴趣的巨大启动序列。

我在valgrind/callgrind.h中找到了可以帮助我的定义:

  • CALLGRIND_START_INSTRUMENTATION
  • CALLGRIND_STOP_INSTRUMENTATION
  • CALLGRIND_DUMP_STATS

根据这篇文章,我必须使用以下选项执行valgrind :

valgrind --tool=callgrind --instr-atstart=no ./application

当我这样做时,会创建两个文件:

  • callgrind.out.16060
  • callgrind.out.16060.1

然后我想使用 kcachegrind 来可视化我的结果。这很好用,但跳过我的启动序列的 makros 似乎什么也没做。我必须做什么才能仅在我想要的地方测量性能?

4

2 回答 2

0

假设您有以下开源程序:

int main()
{
    function1();

    function2();
    
    return 0;
}

假设您只想Callgrindfunction2().

一种方法是在Callgrind周围插入宏function2(),然后重新编译程序(请与上面的比较):

#include <valgrind/callgrind.h>
int main()
{
    function1();

    CALLGRIND_START_INSTRUMENTATION;
    CALLGRIND_TOGGLE_COLLECT;
        function2();
    CALLGRIND_TOGGLE_COLLECT;
    CALLGRIND_STOP_INSTRUMENTATION;

    return 0;
}

在某些情况下,callgrind.h可能找不到类似的问题,请参见此处。可能的解决方案是安装/编译valgrind-devel,请参阅此答案

最后,您需要在callgrind命令中添加两个新选项,例如:

valgrind --tool=callgrind \
    --collect-atstart=no --instr-atstart=no \ #new options
    <program>

这个答案是这个条目的扩展。

于 2021-01-16T16:56:28.807 回答
0

我现在明白了,但我不是 100% 确定为什么。我将尝试描述一下我的代码:

我有一个负责许多子系统的应用程序类。在我最初的尝试中,我尝试像这样测量应用程序内部的性能:

int main(int argc, char *argv[])
{
    Application a(argc, argv);
    return a.exec();
}

void Application::Application(int &argc, char **argv)
{
    m_pComplexSystem = new ComplexSystem();
    m_pComplexSystem->configure();

    CALLGRIND_START_INSTRUMENTATION;
    m_Configurator->start();    
}

Application::~Application()
{
    CALLGRIND_STOP_INSTRUMENTATION;
    CALLGRIND_DUMP_STATS;
    m_pComplexSystem ->stop();

    delete m_pComplexSystem;
    m_pComplexSystem = 0;
}

由于某种原因,定义被忽略了,我得到了整个构造函数的性能度量以及在 ComplexSystem 成员的 configure() 调用中完成的所有事情。

所以现在我使用这个似乎有效的代码:

int main(int argc, char *argv[])
{
    Application a(argc, argv);

    CALLGRIND_START_INSTRUMENTATION;
    int result = a.exec();
    CALLGRIND_STOP_INSTRUMENTATION;
    CALLGRIND_DUMP_STATS;
    return result;
}

虽然和我最初的尝试不完全一样,但我现在可以开始找慢函数了。

于 2015-10-02T11:21:37.313 回答