作为我研究的一部分,我正在寻找替代方案来分析具有显式任务的 OpenMP 代码(根据 OpenMP 3.0)。我的主要目标是研究在计划和执行之前任务在全局障碍(例如任务等待)处空闲时产生的开销量。
我研究了使用最新版本的 TAU,它支持 Opari,它反过来检测源代码以生成分析统计信息。不幸的是,由于它检测源代码,这导致程序执行中的大量开销。
像 Gprof 和 PGprof 这样的工具没有提供我正在寻找的细节。我已经尝试过和他们一起测试过。
我正在寻找一种工具,它可以通过征收最小的开销来帮助我分析 OpenMP 程序的任务。我很想研究 HPCToolkit 和 Scalasca,但我不确定它们是否提供对 OpenMP 任务的支持。
寻找方向和你的建议。谢谢!!