我目前正在使用 ClusterVisionOS 3.1 处理集群。这将是我第一次使用集群,所以我可能还没有尝试过“显而易见的”。
我可以使用“qsub”命令向集群提交单个作业(我可以正常工作)
但是当一次提交多个作业时,问题就开始了。我可以编写一个脚本一次将它们全部发送,但是所有节点都会被我的工作占用,并且这里有更多的人想要提交他们的工作。
所以这是交易:
32 个节点(每个节点 4 个处理器/插槽)
最好的办法是告诉集群使用 3 个节点(12 个处理器)并在这些节点/处理器上排队我的所有作业,如果这甚至可能的话。如果我可以让节点为每个作业使用 1 个处理器,那将是完美的。