我看到很多线程询问经过时间(挂起时间)小于用户+内核时间的情况,并且我了解多线程如何导致这种情况。但是,当通过以下方式定时执行某些 MPI 代码时:
$ 时间 mpirun -n 4 ./a.out
我看到经过的时间范围为 4-5 分钟,用户时间约为 40 秒,内核时间约为 40 秒。我认为进程之间的屏障同步可能是原因的一部分,或者可能只是获取有关单个 MPI 进程的信息,但我仍然无法准确解释导致我的读数的原因。谁能解释一下?
非常感谢。
对于许多进程,我希望挂钟时间大大超过总 CPU 时间。很少有进程受 CPU 限制,因此它们会花费大量时间等待。幸运的是,等待时间不再计入该过程。导致等待的事情:
即使是重型统计软件也可能进行 I/O,这将导致 CPU 利用率低于挂钟时间。
一个极端的例子是将一个大文件从磁盘上的一个分区复制到同一磁盘上的另一个分区。这可能会花费大量的 Wall 时间而 CPU 时间很少。如果您有能力使用ionice
,如果磁盘正忙于其他工作,则可以使 Wall 时间更长。
以下命令显示的实际(挂钟)时间可能会显着高于用户和系统时间的总和。
time bash -c "read ans"
用户/内核时间仅在使用处理器时增加。如果您的代码主要在诸如磁盘或网络 IO 之类的东西上等待,那么实际经过的时间将远远大于 CPU 时间。