0

我在没有管理员访问权限的 Torque 服务器上运行作业。然而,一个插槽似乎经常声称它是免费的,但是当调度程序为其分配一个作业时,该作业会一直排队。因此,我的大量工作将被分配给该服务器并无限期地排队。

有什么方法可以开始这些工作/将它们移动到另一台机器上?或者在提交作业时可能会避开机器?谢谢!

4

1 回答 1

0

如果您没有 root 权限,您可能需要您的系统管理员为您解除阻止该作业。

  1. 检查 qstat -f 输出并查看作业被阻止的原因。可能是您请求的资源多于可用资源。

  2. 将来准确指定您想要的节点(假设您的管理员允许) qsub somejob.sh -l

  3. 如果您使用 Moab 等调度程序,请尝试以下操作(再次,假设您有权限) mjobctl -u mjobctl -l
于 2013-03-31T04:43:43.090 回答