问题标签 [pacemaker]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
9375 浏览

java - UnableError:无法获取cib

我正在尝试为负载均衡器创建集群,以使用 Pace maker 包将我的请求转发到两个 apache 实例。为此,我安装了“corosync、pcs、pacemaker”软件包。我为 node1 和 node2 进行了集群设置。现在,当我尝试使用以下命令创建集群资源时

该命令给出以下错误。

那么我在这里缺少什么吗?

0 投票
0 回答
157 浏览

apache-zookeeper - Zookeeper 可以和 Pacemaker 一起工作吗?

如标题所述,您认为 Zookeeper 可以与 Pacemaker 一起使用而不是 Corosync 吗?有这方面的检查吗?

谢谢你的帮助!

0 投票
1 回答
966 浏览

centos7 - 主动/主动起搏器?

块引用

“我想创建一个有两个节点的 HA 集群。那么,有没有人可以给我配置两个节点与起搏器和 corosync 的配置?我想使用具有主动/主动模式的起搏器。感谢观看我的问题!”

块引用

0 投票
0 回答
2696 浏览

pacemaker - DRBD/pacemaker 两个节点都是从节点

我的高可用性软 Pacemaker 出现错误,我将它与 drbd 一起使用。然后配置,我使用命令 crm_mon 获得下一条消息:

供您参考,以下是起搏器/corosync 的日志:

/var/log/消息

/var/log/cluster/corosync.log

这是 drbd 日志:

和 corosync 日志 :) :

你能帮我解决这个问题吗?

谢谢你的帮助,

杰弗里

0 投票
1 回答
143 浏览

ubuntu - 当 corosync/pacemaker 被杀死时自动重生它

如果 Corosync/Pacemaker 使用"kill -9 <corosync-pid>".

是否需要执行任何步骤才能使 corosync 服务自动启动并运行?

0 投票
1 回答
1452 浏览

redmine - Redmine 高可用性实例

任何人都可以为我提供替代方案以及安装 Redmine HA 实例的步骤吗?

我试图用 Docker swarm 解决它,但它似乎非常复杂。

0 投票
0 回答
699 浏览

high-availability - Pacemaker 两个浮动 IP

我在 Centos7 中遇到了起搏器和两个浮动 ip 的问题。我有两台服务器,每台都有两个网络接口。(公立和私立)。我正在尝试配置两个浮动 ip,一个是公共的,一个是私有的,因为我将在两者中都连接设备。如果两个接口之一失败,我想从一个切换到另一个。因此,使用一个虚拟 IP 系统可以正常工作。有两个,当一个接口发生故障时,ping 停止。这可能是配置步骤:

两台服务器中的 /etc/hosts:

服务器1 10.0.0.80

server1private 192.168.123.80

服务器2 10.0.0.90

server2private 192.168.123.90

服务器1:

enp0s3:inet 10.0.0.80 网络掩码 255.255.255.0 广播 10.0.0.255

enp0s8:inet 192.168.123.80 网络掩码 255.255.255.0 广播 192.168.123.255

服务器2:

enp0s3:inet 10.0.0.80 网络掩码 255.255.255.0 广播 10.0.0.255 enp0s8:inet 10.0.0.80 网络掩码 255.255.255.0 广播 10.0.0.255

在服务器 1 中:

pcs 集群 auth server1 server2

个人电脑集群身份验证星号1私有服务器2私有

pcs cluster setup --name clusterHA server1,server1private server2,server2private

集群开始--全部

pcs 属性设置 stonith-enabled=false

pcs 属性集 no-quorum-policy=ignore

pcs resource create publicIP ocf:heartbeat:IPaddr2 ip=10.0.0.110 cidr_netmask=32 nic=enp0s3 op monitor interval=30s

pcs resource create privateIP ocf:heartbeat:IPaddr2 ip=192.168.123.110 cidr_netmask=32 nic=enp0s8 op monitor interval=30s

pcs 约束 colocation add publicIP privateIP INFINIY

电脑状态正常。corosync-cfgtool -s 没问题。(两环)

个人电脑状态:

集群名称:clusterHA 最后更新时间:2016 年 12 月 1 日星期四 00:29:13 最后更改:2016 年 12 月 1 日星期四 00:29:01 由 root 通过 asterisk1 上的 cibadmin 获得堆栈:corosync 当前 DC:server1(版本 1.1.13-10.el7_2 .4-44eb2dd) - 配置了 quorum 2 个节点和 2 个资源的分区

在线:[ server1 server2 ]

完整资源列表:

publicIP (ocf::heartbeat:IPaddr2): 启动 server2 privateIP (ocf::heartbeat:IPaddr2): Started server2 PCSD Status: server1: Online server2: Online

守护进程状态:corosync:活动/启用起搏器:活动/启用 pcsd:活动/启用

现在,我可以 ping 10.0.0.110 和 192.168.123.110 但是,如果我在服务器 2 接口 enp0s8 中关闭,则 ping 到 192.168.123.110 停止,然后我会收到以下消息:

pcs 状态一切正常,就像以前一样,并且 corosync-cfgtool -s

本地节点 ID 1 RING ID 0

戒指 ID 1

我究竟做错了什么?这样可以吗?或者也许还有其他方法可以做到这一点?提前感谢大家!

0 投票
1 回答
391 浏览

cluster-computing - 有人可以向我解释一下 fence_vmware_soap 是如何工作的吗?

我能够在我的集群中设置fence_vmware_soap,并且我知道它用于防止数据损坏,以便两个节点不会同时写入共享存储(在我的情况下为lun)。在活动节点能够接管并写入共享磁盘之前,围栏将确保不健康的节点完全关闭。

我想知道会发生什么,以及集群中的一个节点如何在不健康的节点使用 fence_vmware_soap 代理杀死自己之前知道另一个节点不健康。

我将非常感谢以非常简单的方式解释它的答案,因为这是我第一次设置 nfs 集群(主动/被动)

0 投票
0 回答
2065 浏览

cluster-computing - Pacemaker - 资源(虚拟)在故障转移时不执行我的脚本

我使用 Pacemaker+Corosync 来处理我的集群。DRBD+FileSystem+IPADDR 资源配置成功并正常运行。

我现在的目的是在发生故障转移时执行我自己的脚本(实际上是启动 oracle 服务)。

正如我在几个地方看到的那样,我将“虚拟”资源代理复制它并修改此文件以在启动函数中运行我的脚本。

我使用新的资源代理创建了我的资源,它已成功创建并且还具有“已启动”状态。

现在的问题是,当资源启动时,我的脚本没有运行(当然,在故障转移和切换时它也没有运行)。

我尝试运行资源命令“pcs resource restart”来强制运行脚本,但它仍然没有运行。

但是当我使用命令“resource debug-start resource-name”时,我的脚本正在运行。

这是我运行命令的配置和状态: 在我放置脚本的资源代理副本中 - /usr/lib/ocf/resource.d/heartbeat/StartOracle

我的 cluster_cfg 文件是:

0 投票
1 回答
377 浏览

high-availability - HA-Pacemaker-如何在我的自定义资源故障中插入自定义错误消息?

我在 Centos7 中使用 Pacemaker + Corosync,我创建了自己的资源代理并创建了一个自定义资源来运行我拥有的一些脚本。

在我的资源代理中,我有一个监控功能,每 x 分钟检查一次,当这个监控功能失败时,我返回“OCF_ERR_GENERIC”,因此所有资源都失败了。

当我执行命令“PCS status”时,我可以看到资源已停止/失败,并且还可以在“失败的操作”中看到有关“未知错误”失败的消息:

有没有办法插入我自己的错误消息而不是这个“未知错误”消息???