3

我在 Centos 7.2 上有一个基于 Pacemaker(v1.1.18-11) 和 corosync(v2.4.3-2) 设置的 Linux 集群 这是一个两个节点设置,节点 = DBHA(主)和DBFAILOVER(从)

我有一个使用此资源代理的资源Postgresql9 : pgsql略有变化

我正在使用标准文档来设置 Postgres 复制:PgSQL_Replicated_Cluster

在为大师完成所有步骤之后,它仍然没有成为大师。/var/log/cluster/corosync.log中显示以下错误

Could not map name=dbha to a UUID

经过一番调试后,我发现以下命令返回上述错误: /usr/sbin/crm_attribute -l reboot -N "dbha" -n "Postgresql9-status" -v "STOP"

其中 Nodename 由以下方式计算:

NODENAME=$(ocf_local_nodename | tr '[A-Z]' '[a-z]')

其中 ocf_local_nodename() 来自 ocf-shellfuncs:

ocf_local_nodename() {
    # use crm_node -n for pacemaker > 1.1.8
    which pacemakerd > /dev/null 2>&1
    if [ $? -eq 0 ]; then
        local version=$(pacemakerd -$ | grep "Pacemaker .*" | awk '{ print $2 }')
        version=$(echo $version | awk -F- '{ print $1 }')
        ocf_version_cmp "$version" "1.1.8"
        if [ $? -eq 2 ]; then
            which crm_node > /dev/null 2>&1
            if [ $? -eq 0 ]; then
                crm_node -n
                return
            fi
        fi
    fi

    # otherwise use uname -n
    uname -n

}

我尝试运行这两个命令crm_node -n ,并且uname -n在 DBHA 节点上都返回以下内容: DBHA

同样在 cibadmin 中:

<nodes> <node id="2" uname="DBHA">...

当我手动运行 crm_attribute 命令设置属性时,它再次返回相同的错误。

这是CIB:CIB

请帮忙

提前致谢

注意:我们在不同的操作系统(CENTOS (6.5,6.7,7.2,7.5) Redhat(7.5) 上有多个设置。我们以前从未遇到过这个问题。此外,节点名称中的大写字母(或小写字母)以前从未引起任何问题.

4

1 回答 1

1

事实证明,pacemaker 更改了获取节点名称的逻辑,crm_attribute并在比较节点名称时留下了一个错误。

这在较新版本的起搏器中已修复 ( 7618c29 )。更新到最新补丁为我修复了它。

于 2019-01-30T12:37:48.070 回答