我继承了在集群上使用 Parallel Python 对一些科学计算的维护。使用 Parallel Python,作业被提交给 ppserver,它(在这种情况下)与其他计算机上已经运行的 ppserver 进程对话,将任务分发给 ppworkers 进程。
我想使用标准库日志记录模块从提交到 ppserver 的函数中记录错误和调试信息。由于这些 ppworkers 作为单独的进程(在单独的计算机上)运行,我不确定如何正确构建日志记录。我必须为每个进程登录到单独的文件吗?也许有一个日志处理程序可以让它变得更好?
另外,我想报告什么计算机上的哪个进程发生了错误,但是我正在编写登录的代码可能不知道这些事情;也许这应该发生在 ppserver 级别?
(在 Parallel Python Forums 上交叉发布的问题版本,如果我从非 SO 用户那里得到有关此问题的信息,我将在此处发布答案)