我在使用 sun Grid Engine 分发作业的集群(starcluster)上使用 numpy 运行相同作业的多次重复。我的每个节点都有 2 个核心(AWS 上的 c3.large)。所以说我有 5 个节点,每个节点有 2 个核心。
numpy 中的矩阵运算一次能够使用多个核心。我发现 SGE 将发送 10 个作业一次运行,每个作业使用一个核心。这导致作业的运行时间更长。看htop,看起来每个核心上的两个工作都在争夺资源。
我如何告诉 qsub 为每个节点分配 1 个作业。这样当我提交作业时,一次只会运行 5 个,而不是 10 个?