问题标签 [automatic-failover]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
90 浏览

centos - Percona 集群自动故障转移不起作用

我正在部署 Percona Xtradb-Cluster 并陷入自动故障转移。当我在数据库中停止节点 2 时不会自动更新状态。这是日志:

2017-06-23 23:37:29 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:39 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:59 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过3 个心跳,回避它并杀死所有连接 2017-06-23 23:38:09 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,回避它并杀死所有连接2017-06-23 23:38:19 MySQL_Monitor.cpp:1126:monitor_ping():[错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:29 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过3 个心跳,回避它并杀死所有连接 2017-06-23 23:38:39 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,回避它并杀死所有连接2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168。 1.11:3306 错过了 3 个心跳,回避它并杀死所有连接monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168。 1.11:3306 错过了 3 个心跳,回避它并杀死所有连接

谢谢。

0 投票
1 回答
749 浏览

java - mysql故障转移后如何用从数据库的数据更新主数据库

我正在使用 Mysql Server 5.6。我已经设置了主从复制并且它工作正常。唯一的问题是,当我启动主服务器时,从属服务器的数据不会自动更新到主服务器。

0 投票
0 回答
150 浏览

azure - 从 Azure VM 故障转移到 Azure Web App

我们希望从Azure VM (Windows Server) 故障转移到Azure Web App。虚拟机托管 Web 应用程序,而 Web 应用程序只是一个通知网站维护中消息的页面。这适用于服务器的计划内/计划外维护事件。维护结束后,如何收回。提前致谢。

0 投票
2 回答
2015 浏览

postgresql - PgPool-II 和 repmgr 自动故障转移

我有用于 HA 的 pgpool-II 和用于自动故障转移的 repmgr。Pgpool-II 也可以运行故障转移 我只是想知道使用 pgpool 或 repmgr 进行自动故障转移?如果 pgpool 可以进行故障转移,我是否需要使用 repmgr?并使用shell脚本来提升新主人?

0 投票
1 回答
67 浏览

mongodb - MongoDB 作为故障转移数据库

如果系统已经在运行 SQL Server,是否可以使用 NoSQL 数据库(特别是 MongoDb)作为 SQL Server 故障转移环境中的故障​​转移数据库?这样,如果主 SQL 节点发生故障,则运行/托管 MongoDb 的辅助节点将占据主要位置。

0 投票
1 回答
341 浏览

nginx - 当 nginx 服务关闭时,Pacemake 不会进行故障转移

我已经为 nginx 设置了 HA-Cluster。因此,当 nginx 或节点发生故障时,它将故障转移到第二个节点。

pcs status 集群名称:push_noti_cluster 堆栈:corosync 当前 DC:push2(版本 1.1.18-11.el7_5.3-2b07d5c5a9) - 具有仲裁的分区 最后更新:2018 年 7 月 31 日星期二 11:29:16 最后更改:2018 年 7 月 31 日星期二:20:05 2018 由 root 通过 cibadmin 在 push1 上

配置了 2 个节点 配置了 3 个资源

在线:[push1push2]

完整资源列表:

virtual_ip (ocf::heartbeat:IPaddr2): 开始 push1 克隆集: Nginx-clone [Nginx] 开始: [ push1 push2 ]

守护进程状态: corosync: active/enabled 起搏器: active/enabled pcsd: active/enabled 你有新邮件在 /var/spool/mail/root [root@server1 ~]#

当我们停止pcs cluster stop在这些节点上使用集群服务或重新启动服务器时,故障转移工作正常。

我们想要实现的是在主机 node01 上的 nginx 停止运行并且资源 virtual_ip/webserver 都应该故障转移到第二个主机 node02 时执行资源故障转移。

是否可以进行服务级别故障转移?即当一个节点(node01)中的一个资源失败时,所有配置的资源(这里是virtual_ip/webserver)都应该故障转移到另一个节点(node02)。

0 投票
1 回答
243 浏览

sql-server - 使用 Azure SQL 的 Azure 自动故障转移组中的问题

我正在使用带有自动故障转移组的 Azure SQL,为此我创建了一个 SQL Server 和一个数据库,并在另一个 SQL Server 中创建了另一个数据库副本,该 SQL Server 是在其他区域的 Geo-Replication 的帮助下创建的。为此,我创建了一个故障转移组并且工作正常。但是在处理这个问题时,有人向我提出了一些疑问,例如:

  1. 我的主要区域(如美国东部)由于发生意外灾难而崩溃,那么我的 SQL 数据库和我所有的故障转移组状况如何。有可能恢复它们吗?

  2. 如果我删除主 SQL 数据库,那么我的故障转移组会发生什么情况?

  3. 如果我删除了我的主 SQL 服务器,那么我的故障转移组工作是否正常?

为了执行上述操作,我点击了链接

0 投票
1 回答
333 浏览

mysql - Sequelize 连接到故障转移写入副本

我正在使用 Sequelize 4.38.0。阅读文档后,我设置了一个包含 2 个只读副本的主写入数据库。我正在尝试为主写入数据库添加故障转移以实现高可用性。续集支持吗?在配置选项中,在“复制”中,您可以传递要读取的主机数组,但不能写入 =\

0 投票
0 回答
814 浏览

postgresql - PostgreSQL/PostDock:主节点中的自动恢复失败

我使用 Docker 服务和 Docker swarm 来部署 PostDock 集群

这是我的 docker-compose.yml 设置:

我跑:

一切顺利。

但是,在我多次更新服务后,主节点上的自动故障转移失败了。在主节点日志文件中,我注意到恢复过程无法检测到数据库 replication_db 和架构 replication_db.public:

如您所见,没有指定模式,只有点号“。” ,并且用户也错了:应该是replication_user,而不是用户public

这导致此错误消息:

据我了解,当自动故障转移成功时,预期的恢复日志应该是:

有人知道这个问题的根本原因吗?

0 投票
1 回答
2397 浏览

azure - Azure SQL 故障转移组,宽限期是什么意思?

我目前正在阅读:https ://docs.microsoft.com/en-us/azure/sql-database/sql-database-auto-failover-group ,我很难理解自动故障转移策略:

默认情况下,故障转移组配置有自动故障转移策略。SQL 数据库服务在检测到故障并且宽限期到期后触发故障转移。系统必须验证由于影响的规模,SQL 数据库服务的内置高可用性基础架构无法缓解中断。如果您想从应用程序控制故障转移工作流程,您可以关闭自动故障转移。

在 ARM 模板中定义故障转移组时:

我像这样指定 readWriteEndpoint :

将 failoverWithDataLossGracePeriodMinutes 设置为 60 分钟。

这是什么意思?我在任何地方都找不到明确的答案。是不是意味着:

  1. 当我的主数据库所在的主区域发生中断时,读/写端点指向主数据库,并且仅在 60 分钟后故障转移到我的辅助数据库,该辅助数据库将成为新的主数据库。在 60 分钟内,读取我的数据的唯一方法是直接使用 readOnlyEndpoint 吗?或者
  2. 如果他们以某种方式可以检测到没有要同步的数据,我的读/写端点会立即打开

我认为它归结为:我是否必须手动进行故障转移,如果我检测到中断,如果我不关心数据丢失,但我希望能够写入我的数据库?

额外的问题:存在宽限期的原因是因为主服务器上可能存在未同步的数据,如果辅助服务器成为新的主服务器(如果我手动切换),这些数据将被覆盖或丢弃?

抱歉,我不能只回答一个问题。我读了很多书,我真的需要知道这一点。