使用 Intel Advisor 和屋顶线模型,我想评估某个功能的性能。此函数使用 Eigen 库进行矩阵运算,其中完成了主要工作。
在输出中,我可以看到我的函数具有相对较小的自时间和几个由我的函数调用的 Eigen 函数。现在我想将我的函数的所有 FLOPS 和内存操作组合在一起(而不是每个单独的函数),并将这个结果用于屋顶线模型。我怎样才能做到这一点?
注意:我在英特尔支持论坛 [1] 中发布了一个类似的问题。
[1] https://software.intel.com/en-us/forums/intel-advisor-xe/topic/806091