2

我想设置一个SLURM 集群。我至少需要多少台机器?我可以从两台机器开始(一台是客户端,一台是客户端和服务器)?

4

2 回答 2

4

正如@Carles 所写,如果需要,您只能使用一台计算机,同时运行控制器 ( slurmctld) 和工作 ( slurmd) 守护程序。

如果您想测试一些配置并观察 Slurm 的行为,您甚至可以使用该-N <hostname>选项在单台机器上运行多个工作守护程序来模拟更大的集群。

如果你想真正完成一些计算,你可以在同一个节点上运行控制器和工作守护进程。如果您希望系统仍然响应,只需配置 Slurm 让它相信系统有 1 个内核和 2GB 的 RAM,而不是它实际上必须为操作系统和 Slurm 守护程序留出一些空间。

作为旁注,您在问题中链接的页面对应于非常旧版本的 Slurm。较新版本的文档托管在Schedmd 的网站上

于 2015-01-05T21:36:30.303 回答
3

您可以开始只使用一台机器,但 2 台机器将是最标准的配置,一台机器作为控制器,另一台作为“工作”节点。使用此模型,您可以将尽可能多的机器添加到集群中作为“工作”节点。这样服务器就不会执行作业,也不会受到作业干扰。

于 2014-12-29T23:50:19.923 回答