我有一个 MPI 程序,它使用 HDF5 库进行并行 I/O。我在调试时遇到了一个奇怪的问题。我已经使用 valgrind 对一个简单的测试用例进行了内存泄漏测试,并且没有报告错误。然后我尝试使用 120、240、360 和 480 核的另一个测试用例。除了出现此错误的 120 核案例外,所有案例都运行:
MPI: MPI_COMM_WORLD rank 108 has terminated without calling MPI_Finalize()
MPI: aborting job
MPI: Received signal 9
我对此感到困惑。错误是什么意思?会不会是因为内存不够?