我正在尝试移植 MS VC++ 程序以在 Rocks 集群上运行!我不太擅长 linux,但我渴望学习,我想移植它对我来说不是不可能完成的任务。但是,我不明白如何利用集群节点。因为似乎执行的代码只在前端服务器上运行(显然)。
我已经阅读了一些关于 MPI 的内容,似乎我应该使用 MPI 在节点之间进行通信。该程序目前是这样编写的,因此我有一个同步所有工作线程的主线程。主线程还接收操作模拟或查询其状态的命令。如果模拟设置正确,执行线程之间的通信可以显着减少。我不明白的是如何在计算节点上启动进程以及如何处理节点中的故障?在移植我的程序以在集群中运行时,也许还应该考虑其他一些事情?