我正在使用 google 的 perftools ( http://google-perftools.googlecode.com/svn/trunk/doc/cpuprofile.html ) 进行 CPU 分析——这是一个很棒的工具,它帮助我执行了大量的 CPU 时间我的应用程序的改进。
不幸的是,我已经明白代码仍然有点慢,并且当使用 g++ 的 -O3 优化级别编译时,我只知道特定函数很慢,但不知道它的哪些方面很慢。
如果我删除 -O3 标志,则程序的未优化部分会超过此函数,并且我不会很清楚地了解函数中缓慢的实际部分。如果我保留 -O3 标志,那么函数的慢部分会被内联,我无法确定函数的哪些部分是慢的。
有什么建议么?谢谢你的帮助!