除了 MPI_ERROR_RETURN 和 MPI_ERRORS_ARE_FATAL 之外,在 OpenMPI 和 MPICH 中是否实现了任何错误处理程序?哪个实现在处理错误方面更好?请建议一个链接以获取有关相同信息的更多信息..
问问题
420 次
1 回答
1
不,这些是当前标准定义的仅有的两个错误处理程序。
MPI 论坛目前正在研究将成为 MPI-3 的内容,错误处理和容错将成为新标准的重要组成部分(有一个致力于该主题的工作组)。然而,在这项工作完成之前,从 MPI 中获得更强容错的唯一方法是使用早期的非标准扩展。 FT-MPI是一个开发了非常强大的 MPI 的项目,但不幸的是它基于 MPI1.2;该标准的一个非常早期的版本。有基于 MPI2的MPICH-V ,但它更多地基于检查点重启。
在检查点重启方面,OpenMPI和MPICH2都支持BLCR ,这是一种透明的检查点重启形式的容错,允许在硬件或网络故障的情况下轻松回滚到最后一个检查点。
于 2011-04-26T13:17:43.670 回答