我们的集群使用 SLURM 来管理工作负载。我想提取一份报告,报告每个帐户在给定日期之后完成的所有作业的 CPU、RAM 和磁盘使用情况。可能吗?
我一直在看 sreport 和 sacct,但似乎无法按照我的意愿自定义它,我能得到的最好的就是
sreport job SizesByAccount start=2015-01-01 -t percent Format=account Grouping=5,9
对于 CPU 使用率。有什么建议么?
谢谢。
如果将来可以帮助某人,我会使用接近的东西
$ sacct -S2020-01-01 -E2020-10-07 -X -oJobID,Elapsed,ReqMem,ReqCPUS,User,Node --parsable
69836|00:00:22|3200Mc|1|user1|slurm-node20|
69837|00:03:06|1200Mc|1|user2|slurm-node15|
69838|00:03:08|3200Mc|1|user1|slurm-node12|
69839|00:00:11|1200Mc|1|user1|slurm-node12|
69840|00:03:01|3200Mc|1|user1|slurm-node10|
[...]
然后用 Python 解析结果。