问题标签 [pacemaker]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
864 浏览

high-availability - 如果 HAProxy 集群将相同的虚拟 IP 分配给多台机器会发生什么?

假设我在集群中运行了两个HAProxy实例,为其他事物提供负载平衡。两个节点的 HAProxy 集群可以使用 Pacemaker 和 Corosync 来实现。

考虑两个节点彼此失去联系(但外部世界仍然可以访问)的情况。在这种情况下,他们将决定两者都采用与该集群关联的虚拟 IP。会不会出现这种情况?如果是这样,您是否必须实施 STONITH 来保护虚拟 IP 资源?没有 STONITH 有没有办法解决这个问题?

0 投票
0 回答
311 浏览

nginx - nginx 中的后端高可用性解决方案

在 nginx 中寻找后端 HA 的可能性/替代方案。目前我们使用的是不支持HttpUpstream 模块的 lua-nginx ,这对我来说是首选。我对起搏器有所了解,但从未使用过它,所以不确定它是否可以与 nginx 很好地结合。任何提示,经验?

0 投票
1 回答
1029 浏览

python - celery beat HA - 使用起搏器?

据我所知,celery beat 是一个被认为是 SPOF 的调度程序。这意味着服务崩溃,没有任何东西会被安排和运行。

我的情况是,我需要一个带有两个调度程序的 HA 设置:主/从,主周期性地进行一些调用(比如说每 30 分钟),而从可以空闲。

当 master 崩溃时,slave 需要成为 master 并从死去的 master 身上捡起剩下的东西,并执行周期性任务。(领导人选举)

这里的要求是:

  1. 任务每 30 分钟安排一次(这可以通过 celery beat 来实现)
  2. 该任务不是原子的,它不仅仅是每 30 分钟一次失败或成功的调用。假设每 30 分钟,该任务会发出 50 个不同的调用。如果 master 完成 25 次并崩溃,slave 预计会出现并完成剩余的 25 次,而不是再次完成所有 50 次调用。
  3. 当死掉的master从故障中重新启动时,它需要意识到已经有一个master在运行。无论如何,它不需要作为主人出现,只需要保持空闲直到正在运行的主人再次崩溃。

起搏器与芹菜相结合是实现这一目标的正确工具吗?

0 投票
1 回答
1334 浏览

zabbix - 当我停止 zabbix 服务时起搏器无法启动我的 zabbix 服务

我想使用 corosync+pacemaker+zabbix 来实现高可用。跟随是我的配置

我的 crm_mon 状态是:

现在我停止zabbix1上的zabbix-ha服务,等待300s,pacemaker无法启动我的zabbix-ha服务:

我的 zabbix-ha 脚本可以crm resource stop/start zabbix-ha用来停止/启动我的 zabbix-ha。

0 投票
2 回答
2249 浏览

cluster-computing - 拔掉网线,Node 认为自己在线。起搏器/Corosync

我正在尝试将 2 台计算机与 Pacemaker/Corosync 一起集群。他们共享的唯一资源是 ocf:heartbeat:IPaddr 这是主要问题:

由于只有两个节点,因此只有在no-quorum-policy=ignore.

当从节点 A 拔出网线时,节点 A 上的 corosync 绑定到 127.0.0.1,pacemaker 认为节点 A 仍然在线,而节点 B 是离线的。

Pacemaker 尝试在节点 A 上启动 IPaddr,但由于没有网络连接而无法启动。另一方面,节点 B 识别出节点 B 处于离线状态,如果 IPaddr 服务在节点 A 上启动,它将成功地在其自身(节点 B)上启动它。

但是,由于服务无法在节点 A 上启动,它会进入致命状态,必须重新启动才能重新加入集群。(您可以重新启动一些需要的服务。)

1解决方法是start-failure-is-fatal="false"使节点A继续尝试启动IPaddr服务直到成功的设置。这样做的问题是,一旦成功,两个节点之间就会发生 ip 冲突,直到它们重新集群并且其中一个节点放弃资源。

我正在玩弄一个节点属性的想法,该节点属性cat /sys/class/net/eth0/carrier在电缆连接时为 1,在电缆断开时为 0,然后有一个位置规则,如果“已连接”== 零则不启动服务类型事情,但我们会看到。

任何想法或想法将不胜感激。

0 投票
1 回答
884 浏览

sip - Asterisk HA 和 SIP 注册

我用 Pacemaker/Corosync/DRBD 设置了一个主动/被动集群。我想制作一个 Asterisk 服务器 HA。该解决方案完美运行,但是当服务在一台服务器上失败并在另一台服务器上启动时,所有使用活动服务器注册的 SIP 客户端都将丢失。被动服务器在以下输出中不显示任何内容:

直到客户再次拨打电话或注册。一种解决方案是将客户端的注册率设置为 1 分钟左右。还有其他选择吗?例如,将 Asterisk 与 DBMS 集成有助于将这种状态保存在 DB 中?

0 投票
1 回答
800 浏览

crm - 为起搏器配置 crmsh 以实现高可用性时出错

我已经为“高可用性”安装了起搏器fedora 18。但是没有得到crm命令。当我为此安装 crmsh时,我在配置过程中遇到错误。

0 投票
2 回答
1521 浏览

linux - 有什么方法可以通过“crm”命令从 Linux-HA 集群中找出主节点?

我有一个基于 Linux-HA 的集群(主节点/从节点),并且在 Pacemaker 上定义了一些资源,我的问题是我们可以通过“ crm”命令使用什么方式来找出这个 Linux-HA 集群的主节点?我的意思是在所有资源代理加载之前或资源加载期间的时间段?

资源加载完成后,我想我们可以在 Master Node 上使用crm_monor " crm status" 和 grep 资源来识别它。但我无法在资源加载之前或期间找出一种方法。

谢谢,埃姆雷

0 投票
1 回答
2806 浏览

cluster-computing - 哪个是pacemaker的官方命令行包?crmsh 还是个人电脑?

我正在使用 Linux-HA 集群pacemaker-1.1.10-1.el6_4.4,如您所知,在此起搏器版本中,集群命令行功能未与起搏器软件包打包,我找到了 2 个软件包:crmsh而且pcs,我的问题是哪一个是官方命令行界面?哪一个是推荐的?它们之间的关系是什么?

谢谢,
埃姆雷

0 投票
1 回答
2232 浏览

linux - 是否有任何方法/api来识别Linux-HA集群的主/从节点?

我正在设置一个包含 2 个节点的 Linux-HA(corosync+pacemaker) 集群,并且我定义了几个资源:

我的问题是我们能否在起搏器开始之前或加载服务期间确定哪个节点将成为主节点?我的意思是virutal-ip资源将在哪个节点上运行?有没有crm命令行api或其他方法?

谢谢,
埃姆雷