5

我需要在每台机器有多个插槽的集群上启动 Condor 作业。

我有一个额外的要求,不能在同一台物理机器上同时放置两个作业。这是由于一些我无法控制的二进制文件执行一些网络(很差)。

这是一个有点相关的问题:限制 condor 调度的并发进程数量, 但它并不能完全解决我的问题。我知道我可以通过以下方式限制作业可以在哪里运行:Requirements = (name == "slot1@machine1") || (name == "slot1@machine2") ... 但是,这太受限制了,因为只要两个作业不在同一台机器上,我不在乎作业运行哪个插槽。

有没有办法做到这一点?

如果这是不可能的,我怎么能告诉 condor 选择拥有最多可用插槽的机器?

4

1 回答 1

0

您可以尝试condor_status命令来检查机器池的状态。
第一列显示插槽和机器的名称

现在检查State - Activity

  • Unclaimed: 插槽空闲
  • Claimed-Busy: 插槽正在运行 Condor 作业
于 2016-04-28T17:51:15.520 回答