我正在使用mpiexec
(mpich2)运行一些工作。
mpiexec
进程以非零状态退出,留下一些工作进程
我可以打印正在运行的子作业列表:
$ps aux | grep mpi
还有另一种列出运行/挂起作业的方法吗?
如果 MPI 离开僵尸进程(这很奇怪,这真的不应该发生),它将被命名为您最初执行的可执行文件的名称。所以如果你开始你的程序:
mpiexec -n 4 ./a.out
那么你需要搜索
ps aux | grep a.out
这将为您提供所有仍在运行的进程的列表。您的建议通常不起作用的原因是,如果mpirun
ormpiexec
进程已经消失(由于崩溃或完成),您显然无法继续搜索它。但是,出于某种原因,孩子们可能仍然在身边。
这可能对您有所帮助:ps aux | grep MPICH