是否可以将WPR/xperf分析数据加载到KCacheGrind中?或者有没有办法直接在WPA中聚合函数调用?还是其他什么工具?gprof2dot /graphviz路线会是最佳选择吗?
我发现 WPA 很有用,但在“CPU 使用率(采样)”表中按堆栈分组似乎不允许按聚合函数调用计数进行排序。例如,如果函数foo
从 10 个不同的地方被平均调用,则很难将其识别foo
为潜在的瓶颈,因为 10 个代码路径中的每一个都foo
将显示为权重的 10% 或更少。KCacheGrind 通过允许您对每个函数的累积时间进行排序来解决这个问题。
如何按在 Windows 上进行分析的每个函数中花费的累积时间进行排序,例如将 malloc 等低级共享函数识别为瓶颈?