我有一个包含 10 个节点的集群,所有这些节点都具有相似的操作系统(ubuntu 10.4)。我想监控每个节点的性能,基本上在给定时间捕获 CPU、内存等。我如何在每个节点上捕获相同的并聚合结果得到组合结果示例整个集群的平均 CPU 使用率。
是否有任何命令我可以运行并获得结果。
提前致谢。
我有一个包含 10 个节点的集群,所有这些节点都具有相似的操作系统(ubuntu 10.4)。我想监控每个节点的性能,基本上在给定时间捕获 CPU、内存等。我如何在每个节点上捕获相同的并聚合结果得到组合结果示例整个集群的平均 CPU 使用率。
是否有任何命令我可以运行并获得结果。
提前致谢。
您可以使用 pbsnodes 命令的输出来捕获此信息。如果您查看状态:
status = rectime=1319751989,varattr=,jobs=,state=free,netload=904408724,gres=,loadave=0.63,ncpus=6,physmem=8193856kb,availmem=14823060kb,totmem=16581436kb,idletime=362,nuers=1 ,nsessions=15,sessions=1788 1171 19146 19183 19197 19207 19217 19282 19329 19553 19617 20238 20292 20535 20601,uname=Linux napali 2.6.38-12-generic #51-Ubuntu SMP Wed Sep 28 14:27:32 UTC 2011 x86_64 ,opsys=linux
您可以在那里看到它具有计算机的平均负载,以及有关机器内存状态的几条信息。通过编写一些脚本来解析执行您正在寻找的计算,您可以解决您的问题。