2

当我从中央管理器运行命令 condor_status 时,我使用 condor 作为中间件连接三台服务器以形成 HPC 集群,它没有显示其他节点我可以在中央管理器中运行作业并通过 SSH 连接到其他节点但似乎condor 配置文件中缺少某些内容,我将中央管理器设置为 condor 主机,并允许所有人读写。我将守护进程 MASTER, STARTD 保留在工作节点的守护进程列表中。

当我在中央管理器中运行 condor_status 时,它只显示中央管理器,当我在计算节点上运行它时,它给我错误“CEDAR:6001:Failed to connect to”,后跟中央管理器 IP 和端口号。

4

3 回答 3

2

我设法解决它。问题出在正在运行的中央管理器的防火墙(在我的情况下是 iptables)中。所以,当我停止防火墙(su -c "service iptables stop")时,所有节点都正常出现,输入 condor_status"。

可以使用“service iptables status”检查防火墙状态。

于 2012-02-13T19:55:44.187 回答
0

这里可能会发生很多事情。我建议您遵循本教程,看看它是否可以解决您的问题 -

http://spinningmatt.wordpress.com/2011/06/12/getting-started-creating-a-multiple-node-condor-pool/

于 2012-02-12T21:47:18.133 回答
0

在我的情况下,服务“condor.exe”没有在服务器上运行。我已经手动停止了。我刚开始,一切都很顺利。

于 2017-01-17T16:53:32.833 回答