我有一个表现良好的例程。但是,我不得不对其进行更改。这一变化提高了例程的精度,但损害了性能。
该例程包含大量数学计算,并且可能是 CPU 绑定(我仍然需要对此进行更严格的测试,但我有 99% 的把握)。它是用 C++ 编写的(编译器是 Borland C++ 6)。
我现在想测量例程的性能,首先我考虑测量执行时间,但在我看来这是一种有缺陷的方法,因为可能会有更多的事情发生。
然后我遇到了这个话题:测量应用程序性能的技术 - 堆栈内存溢出。我喜欢通过 MFlops 进行测量的想法。
我的老板建议尝试通过 cpu 时钟周期进行某种测量,因此测试将与机器无关,但是,我认为这种方法属于 MFlops 测试。
在我看来,衡量这两件事(执行时间和 MFlops)是要走的路,但我想听听 stackoverflow 专家的意见。
测量被称为 CPU 绑定的例程性能的方法是什么?