在使用 gprof 分析我编写的 C++ 程序的过程中,我注意到绝大多数执行时间都花在了函数“frame_dummy”上。更准确地说,来自 gprof 输出的平面配置文件中的第一个条目显示了 76.38% 的采样时间花费在和 24611191 次调用名为 frame_dummy 的函数上。
简而言之,我试图理解 frame_dummy 指的是什么——因为我没有任何这样命名的函数——以及这对我的优化工作意味着什么。
虽然不太可能相关,但我应该补充一点,该程序旨在使用多重网格算法求解泊松方程,并采用 MPI 来并行化任务。但是,尽管存在 MPI 函数调用,但上面提到的 gprof 输出是从仅运行单个进程中得出的。我还应该注意,我的程序除了 MPI 之外没有任何依赖项,并且是使用 g++ 4.6.1 编译的。