1

我正在由 pbs_torque 管理的集群中使用 rpy2 运行一个简单的 Python 程序。我的问题是同一段代码运行良好,而其他时间在没有逻辑原因或错误跟踪的情况下被杀死。在程序执行期间的随机点,执行结束。我得到的唯一输出错误是:

kill: 20: 没有这个进程

我不需要提及,我没有打印该消息。一些输出错误文件甚至多次包含此消息。我已经进行了一些搜索,但没有找到任何相关的帮助。集群的所有节点都具有相同的配置,并且应该每个核心运行一个程序实例。

欢迎提出建议。

谢谢

4

0 回答 0