我已经使用 Java 和 MPJ Expresss 开发了一个 MPI 应用程序。它在多核配置中完美运行。
最近,它被授予我访问分布式内存环境的权限,以测试我的应用程序。首先,我使用 MPJ HelloWorld 应用程序检查集群配置是否运行良好。之后,我继续运行我的应用程序,但它在显示后冻结:
MPJ Express (0.38) 在集群配置中启动
更糟糕的是,我使用 Ctrl+C 终止了该进程,但我无法运行 HelloWorld 应用程序。我不得不杀死所有机器中的 MPJ 守护程序并重新启动它们。
我什至用 HelloWorld 类的相同内容替换了我的主类的内容,看看它是否打印了一些东西。它没有。此外,我创建了一个与我的应用程序具有相似包结构的 HelloWorld 应用程序,并且 HelloWorld 运行良好。
我可以注意到 HelloWorld 和我的应用程序之间的一个重大差异是我有一组大小约为 29.8 MB 的库,因此我尝试不将这些库添加到执行类路径中。它有效,但当然,我的应用程序没用,因为它在运行时找不到所需的库。
我将不胜感激任何意见和建议。
谢谢!