1

我正在使用 GE2011.11。以前,我使用的是 Torque/Maui。在毛伊岛,有一个分区的概念,借助它我们可以在逻辑上划分集群。一个节点不能属于多个分区。

在 GE 中,我正在考虑使用主机组来实现这一点,但是一个节点(主机)可以属于多个主机组,这是不可取的。任何想法,我们如何实现与主机组的分区?

在 GE 中,有一个特性叫做多集群。我们可以使用这个特性来实现分区吗?任何想法,我们如何使用它?

4

2 回答 2

0

使用 SGE,您可以手动修改主机组,以便主机(节点)仅存在于单个主机组中。然后,您可以创建仅使用单个主机组的队列。然后用户将作业提交到特定队列(它们本身可以受用户限制)以访问特定的主机组。这将有效地划分您的网格。

执行此设置时要注意的基本事项与 all.q 队列和 @allhosts 主机组有关。如果您从 @allhosts 组中删除所有主机,您应该可以这样做。

如果您还有其他问题,请告诉我,我很乐意提供帮助,因为我多年来一直在管理 SGE 集群。

于 2012-08-31T00:08:47.543 回答
0

由于管理员定义了主机组的成员资格,因此只需定义组以免重叠。如果您想控制哪些用户可以在哪个分区上运行,您可以通过为每组用户定义 Grid Engine acls/usersets 并使用增强的队列配置语法将不同的列表与队列定义中的每个主机组相关联来做到这一点。

user_lists chemists,[@physicshosts=physicists],[@biologyhosts=biologists]

如果您尝试做的是确保给定作业在一组主机或另一组主机上运行但不是混合运行,那么您需要定义多个相同的并行环境并使用类似的技巧将每个 PE 与不同的主机组相关联。

pe_list mpich-A,[@switchb=mpich-B],[@switchc=mpich-C]

然后,用户在提交作业时请求通配符 PE:

#$ -pe mpich-* 8
于 2013-10-20T10:17:39.633 回答