当我正在编写 CPP 代码以应用 MPI 时。我收到错误,因为作业 1 cssmpi1h.uwb.edu_41278 中的等级 3 导致等级 3 的所有等级退出状态的集体中止:被信号 9 杀死
我在一个最大运行 500 次的 while 循环中应用 MPI,但目前,对于我的数据集,它运行大约 20-25 次并从循环中中断。我已经成功编译了代码并运行了它。当它在循环中运行 20 次时,我得到了一次所需的输出。后来我尝试再次运行它,它在循环中的第 5 次或第 8 次停止。它突然停止。我尝试使用 ps -u uname 杀死当前正在运行的进程,然后使用 kill -9 PID 杀死它。但这也行不通。我也尝试更改从节点,它没有工作。
请在下面找到我的代码的高级视图。
如果代码或设置有问题,请告诉我。我的猜测是堆空间问题或由于 MPI_FINALIZE,从节点断开连接,并且 0 级无法继续。了解此问题是否有任何解决方案将很有帮助。
请在此处找到代码 - https://drive.google.com/drive/folders/1PUbunQdFo1199CIkQCdY4L_D50iLU-pD?usp=sharing