我试图在多个线程上尽可能准确地测量一些代码的执行时间,同时考虑上下文切换和线程停机时间。该应用程序是用 C# (VS 2008) 实现的。例子:
public void ThreadFunc ()
{
// Some code here
// Critical block #1 begins here
long lTimestamp1 = Stopwatch.GetTimestamp ();
CallComplex3rdPartyFunc (); // A
long lTimestamp2 = Stopwatch.GetTimestamp ();
// Critical block #1 ends here
// Some code here
// Critical block #2 begins here
long lTimestamp3 = Stopwatch.GetTimestamp ();
CallOtherComplex3rdPartyFunc (); // B
long lTimestamp4 = Stopwatch.GetTimestamp ();
// Critical block #2 ends here
// Save timestamps for future analysis.
}
public int Main ( string[] sArgs )
{
// Some code here
int nCount = SomeFunc ();
for ( int i = 0; i < nCount; i++ )
{
Thread oThread = new Thread ( ThreadFunc );
oThread.Start ();
}
// Some code here
return ( 0 );
}
我想尽可能准确地测量上述两个关键代码块的执行时间。标记为A和B的两个调用可能是很长的函数调用,有时可能需要几秒钟才能执行,但在某些情况下,它们可能会在几毫秒内完成。
我在多个线程上运行上述代码 - 介于 1 到 200 个线程之间,具体取决于用户输入。运行此代码的计算机有 2-16 个内核 - 用户在较弱的机器上使用较低的线程数。
问题是A和B都是潜在的长函数,因此在它们的执行过程中很可能至少会发生一次上下文切换——可能不止一次。所以代码得到 lTimestamp1,然后另一个线程开始执行(并且当前线程等待)。最终,当前线程重新获得控制权并检索 lTimestamp2。
这意味着lTimestamp1和lTimestamp2之间的持续时间包括线程实际未运行的时间 - 它在其他线程执行时等待再次调度。然而,滴答计数无论如何都会增加,所以持续时间现在真的是
代码块时间 = A + B +在其他线程中花费的一些时间
虽然我希望它只是
代码块时间 = A + B
对于大量线程来说,这尤其是一个问题,因为它们都有机会运行,因此上述时间会更高,而所有其他线程在相关线程获得另一个运行机会之前运行。
所以我的问题是:是否有可能以某种方式计算线程未运行的时间,然后相应地调整上述时间?我想完全或至少尽可能多地消除(减去)第三项。代码运行了数百万次,因此最终的时间是从大量样本中计算出来的,然后取平均值。
我不是在寻找分析器产品等 - 应用程序需要尽可能准确地对这些标记的部分进行计时。函数A和B是第 3 方函数,我不能以任何方式更改它们。我也知道在以纳秒精度测量时间时可能出现的波动以及这些 3rd 方函数内部可能存在的开销,但我仍然需要进行此测量。
任何建议将不胜感激 - C++ 或 x86 汇编代码也可以。
编辑:似乎不可能实现这一点。Scott 下面的想法(使用 GetThreadTimes)很好,但不幸的是 GetThreadTimes() 是一个有缺陷的 API,它几乎从不返回正确的数据。感谢所有的答复!