我试图找到一种方法来查看已完成作业的等待时间,直到它们在以 SLURM 作为工作负载管理器的集群上启动。
我知道“sacct”命令可以打印很多关于已完成作业的信息,但我没有发现任何对我的任务有用的信息。
完美将是:
- 作业在开始之前排队的时间
- 我提交作业的时间戳或日期(然后我可以计算等待时间,因为“sacct”通过“开始”字段提供有关作业开始时间的信息)
你有什么有用的提示吗?
我试图找到一种方法来查看已完成作业的等待时间,直到它们在以 SLURM 作为工作负载管理器的集群上启动。
我知道“sacct”命令可以打印很多关于已完成作业的信息,但我没有发现任何对我的任务有用的信息。
完美将是:
你有什么有用的提示吗?
可以从如下sacct
命令获取作业的排队时间:
sacct -X -j <jobid> -o Reserved
该Reserved
列是,(来自sacct 手册页)
保留 多少挂钟时间用作此作业的保留时间。这是根据作业从符合条件的时间到实际开始的等待时间得出的。格式与 Elapsed 相同。
请注意,这与 Slurm 中所谓的“高级资源预留”无关。
基本上,作业“提交”和该作业“符合条件”的时间通常是相同的,但在某些情况下除外,例如当作业使用--hold
或 提交时--dependency
。
该sacct
命令具有:sacct -o start,submit
应该提供您需要的所有信息。