1

我想在 RHEL 6 单机(32 个 CPU)上安装 TORQUE。

我按照手册的所有说明进行安装,但最后我遇到了错误。以下是我遵循的所有步骤:

第一步,确保 libxml2-devel openssl-devel gcc gcc-c++ 已安装并且是最新的:

    # yum install libxml2-devel openssl-devel gcc gcc-c++
    Setting up Install Process
    Package libxml2-devel-2.7.6-14.el6.x86_64 already installed and latest version
    Package openssl-devel-1.0.1e-16.el6_5.x86_64 already installed and latest version
    Package gcc-4.4.7-4.el6.x86_64 already installed and latest version
    Package gcc-c++-4.4.7-4.el6.x86_64 already installed and latest version
    Nothing to do

然后我下载并提取了最后一个版本。然后我运行了默认配置:

    # ./configure

我运行了 make 和 make install:

    # make
    # make install

没有错误。

我将 trqauthd 守护进程配置为在系统启动时自动启动:

    # cp contrib/init.d/trqauthd /etc/init.d/
    # chkconfig --add trqauthd
    # echo /usr/local/lib > /etc/ld.so.conf.d/torque.conf
    # ldconfig
    # service trqauthd start
    Starting TORQUE Authorization Daemon: hostname: x6540
    Currently no servers active. Default server will be listed as active server. Error  15133
    Active server name: x6540  pbs_server port is: 15001
    trqauthd daemonized - port 15005
                                                       [  OK  ]

那里有第一个错误。

错误代码的意思是:

    PBSE_SERVER_NOT_FOUND   15133   Could not connect to batch server

无论如何,我一直安装到最后,我设法启动了妈妈和服务器服务,但最终得到了:

    # pbsnodes 
    localhost
         state = down
         np = 30
         properties = CIS
         ntype = cluster
         mom_service_port = 15002
         mom_manager_port = 15003

你能帮助我吗?我可以为您提供所需的所有日志/信息。谢谢!!

4

2 回答 2

1

只需在客户端节点中以 root 身份运行trqauthdpbs_mom 。

于 2015-01-05T09:37:07.153 回答
0

这实际上不是一个错误,它只是告诉您它找不到任何活动的 pbs_server 进程。稍后当您启动 pbs_server 进程时,一切都会正常工作。

或者如果您先运行“service pbs_server start”,您将不会看到错误。

于 2014-04-16T03:57:48.647 回答