我有一个使用 Sun Grid Engine 在 SMP 并行环境中运行的工作。这段代码很好用,通常可以正常工作。代码比处理器密集型更占用内存,所以我通常使用 -pe smp 12 在我们的集群上保留整个节点(我们有 12 个核心/节点),即使作业本身(在提交的脚本中指定)只使用一小部分那个。
因为我要求的是 SMP 并行环境,所有 12 个插槽都应该来自同一个节点,并且应该有 1 个插槽/核心,对吗?因此,这应该保留整个节点。直到最近,它为此目的工作得很好。另一个用户提交了一个作业,该作业以某种方式在同一节点上获得了槽,最近也使用了网格引擎。我不确定这是怎么发生的。Grid Engine 是否会以少于请求的插槽数来启动我的 SMP 作业?如果没有,是否有更好的方法来确保我的作业保留整个节点?