2

我们的集群使用 SLURM 来管理工作负载。我想提取一份报告,报告每个帐户在给定日期之后完成的所有作业的 CPU、RAM 和磁盘使用情况。可能吗?

我一直在看 sreport 和 sacct,但似乎无法按照我的意愿自定义它,我能得到的最好的就是

sreport job SizesByAccount start=2015-01-01 -t percent Format=account Grouping=5,9

对于 CPU 使用率。有什么建议么?

谢谢。

4

1 回答 1

1

如果将来可以帮助某人,我会使用接近的东西

$ sacct -S2020-01-01 -E2020-10-07 -X -oJobID,Elapsed,ReqMem,ReqCPUS,User,Node --parsable
69836|00:00:22|3200Mc|1|user1|slurm-node20|
69837|00:03:06|1200Mc|1|user2|slurm-node15|
69838|00:03:08|3200Mc|1|user1|slurm-node12|
69839|00:00:11|1200Mc|1|user1|slurm-node12|
69840|00:03:01|3200Mc|1|user1|slurm-node10|
[...]

然后用 Python 解析结果。

于 2020-10-07T07:04:35.627 回答