我已经在具有 2 个节点的 Raspberry Pi 集群上安装了 Torque 4.2.0。在服务器上安装 Torque_server 和 Torque_sched,在节点上安装 Torque_mom。我设法成功运行 qsub 脚本,但是,在安装“其他”mpiexec 之后(如此处建议:http ://www.cslu.ogi.edu/~zak/debianclusters/MPICH_with_Torque_Functionality ),如果我运行运行 mpiexec 的 qsub 脚本我收到以下错误:
socket_connect 错误(验证 trqauthd 正在运行)连接到 trqauthd 时出错(-1)-[无法连接到 socket_connec t_addr 中的端口 -1 - errno:9 错误的文件描述符] 与 MasterCruz2(172.20.45.225)mpiexec 通信时出错:错误: get_hosts:pbs_connect:没有错误。
我做了一些研究,但除了一封死胡同的旧电子邮件外什么也找不到。有什么帮助或想法吗?