0

我有带有 corosync 和起搏器的集群 nfs 服务器。

我成功安装了环境,然后我在测试时发现了一个问题。

在此处输入图像描述

该屏幕是在添加资源后捕获的。

nfs1 服务器运行良好,所有资源都由起搏器监视。

停止 nfs-service 后出现问题。

如果我输入命令“systemctl stop nfs”,nfs 服务将停止。然后集群自动移动到nfs2(这没关系)

在此处输入图像描述

然后我输入命令“pcs cluster standby bp-nfs2”,结果集群服务器被移动到 bp-nfs1,所有资源都在没有 nfsserver 的情况下被占用。

在此处输入图像描述

  1. 即使我再次启动 nfs-service,pacemaker 的 nfs 资源仍然停止。

  2. 我希望起搏器在起搏器启动时使 nfs-service 运行。

这是 nfs 资源创建推荐。

pcs 资源创建 nfsserver ocf:heartbeat:nfsserver \ nfs_shared_infodir="/mnt/sharedisk/" \ --group 资源组

有人知道这个问题,请教我。

如果你看不懂我的英语,我很抱歉。谢谢你。

4

1 回答 1

0

自己解决了。

原因。

如果资源因故障而停止,则该资源具有 FailAction。我们可以通过 pcs status 推荐查看哪些资源具有 failAction。

Pacemaker 从不开始监视有故障的资源,这是起搏器的规范。

解决方案。

使用推荐“pcs resource cleanup [resource name]”手动清除故障操作。

如果要自动清理,请输入此命令“pcs resource defaults failure-timeout=60s”。

当您的资源发生故障时,您的激活节点会移动到另一个节点(故障转移)。

然后开始看起搏器资源。然后在 60 秒后自动清理故障操作。

于 2018-07-20T06:58:21.423 回答