1

我正在使用drmaa-python向 SGE(Sun Grid Engine)提交和监视作业。我在 GUI 中有以下状态

  • 队列中活动的作业
  • 运行作业
  • 已完成的工作
  • 失败的工作
  • 状态未定

有时我得到的工作很少状态未确定当我在 SGE 主机的终端中使用qstat检查作业状态时,我可以看到所有作业都在运行,而没有一个作业失败。Status Undetermined通常会误导用户,因为用户可能认为Status Undetermined作业存在某种问题。

所以,我知道问题不在于 SGE,而在于 drmaa-python 库。

有谁知道为什么 drmaa-python 无法确定状态?

4

1 回答 1

2

drmaa-python 只是 DRMAA C 库的一个瘦 ctype 包装器,没有任何专用逻辑。出于这个原因,您看到的 UNDETERMINED 状态是 SGE DRMAA C 库在您询问时提供的状态。

据我所知,SGE 的 DRMAA C 库有时可能无法获取状态。我建议在您的 python 应用程序中添加一些自定义重试逻辑,以简单地重新询问调度程序。

于 2013-02-28T20:10:20.173 回答