parallel-processing - 使用 Sun Grid Engine 为 SMP 作业保留整个节点？

Question

我有一个使用 Sun Grid Engine 在 SMP 并行环境中运行的工作。这段代码很好用，通常可以正常工作。代码比处理器密集型更占用内存，所以我通常使用 -pe smp 12 在我们的集群上保留整个节点（我们有 12 个核心/节点），即使作业本身（在提交的脚本中指定）只使用一小部分那个。

因为我要求的是 SMP 并行环境，所有 12 个插槽都应该来自同一个节点，并且应该有 1 个插槽/核心，对吗？因此，这应该保留整个节点。直到最近，它为此目的工作得很好。另一个用户提交了一个作业，该作业以某种方式在同一节点上获得了槽，最近也使用了网格引擎。我不确定这是怎么发生的。Grid Engine 是否会以少于请求的插槽数来启动我的 SMP 作业？如果没有，是否有更好的方法来确保我的作业保留整个节点？

score 0 · Accepted Answer

0

我想到了。第二个作业被错误地提交到包含所有核心的默认“全部”队列。

于 2012-05-15T16:13:40.280 回答

parallel-processing - 使用 Sun Grid Engine 为 SMP 作业保留整个节点？

1 回答 1

Related

Reference