0

我目前正在使用 ClusterVisionOS 3.1 处理集群。这将是我第一次使用集群,所以我可能还没有尝试过“显而易见的”。

我可以使用“qsub”命令向集群提交单个作业(我可以正常工作)

但是当一次提交多个作业时,问题就开始了。我可以编写一个脚本一次将它们全部发送,但是所有节点都会被我的工作占用,并且这里有更多的人想要提交他们的工作。

所以这是交易:

32 个节点(每个节点 4 个处理器/插槽)

最好的办法是告诉集群使用 3 个节点(12 个处理器)并在这些节点/处理器上排队我的所有作业,如果这甚至可能的话。如果我可以让节点为每个作业使用 1 个处理器,那将是完美的。

4

1 回答 1

0

好的,所以我想我发现了,这个问题没有解决方案。我个人的解决方案是编写一个脚本,通过 ssh 连接到集群,然后让脚本检查您的用户名下已经运行了多少作业。该脚本会检查该数量是否同时不超过 20 个作业。只要未达到此数字,它就会继续提交作业。

也许它是一个丑陋的解决方案,但一个有效的解决方案!

关于处理器的事情,作业已经提交给不同的单个处理器,充分利用了节点的全部范围。

于 2010-03-30T08:45:46.277 回答