1

首先我想说我不确定这是问这个问题的正确地方,我猜是我们,但是......如果它更适合另一个 stackexchange 站点,请告诉我。

三个月前,我负责一个由六台计算机 (Suse Linux 9.2) 组成的集群,该集群以预报模式运行气象模型。最近,由于电源中断,其中一个节点崩溃了。安装 Lubuntu 12.04(Suse 9.2 磁盘不可用,只有 10.2)后,我尝试将此计算机重新连接到集群:

  • 安装openssh服务器
  • 无需密码即可运行 ssh-keygen 到 ssh
  • 已安装 NFS 支持
  • 编辑 /etc/fstab
  • 编辑 /etc/hosts

然后我尝试运行遇到的模型,但收到以下错误消息:

rm_1993: p4_error: Could not gethostbyname for host thalassa; may be invalid name : 61
p0_12316: p4_error: Child process exited while making connection to remote process on thalassa3: 0

谷歌搜索后,我发现了一些关于 /etc/resolv.conf 的问题,然后编辑了这个文件:

域 ceam.es dns 名称服务器 192.168.1.1 名称服务器 127.0.0.1

但是错误信息仍然出现。我想我遗漏了一些东西,我不是专家系统管理员,但我必须处理。

你可以在这里找到错误日志主机resolv.conf

任何帮助或想法将不胜感激,我将继续在网上搜索解决方案。

提前致谢

4

1 回答 1

1

这些消息表明您正在运行原始 MPICH 软件(通常称为 MPICH1)。尽管您可以将其重新组合在一起以使您的系统正常工作,但您真的不应该运行这种长期以来不受支持的软件。

我建议升级到现代 MPICH(以前称为 MPICH2)v3.0.1 或更高版本。安装和配置应该相当容易,尽管您正在运行的任何旧应用程序代码都有可能不欣赏现代 MPICH 包含的额外错误检查。

http://www.mpich.org/

于 2013-01-30T23:50:18.430 回答