问题标签 [automatic-failover]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
centos - Percona 集群自动故障转移不起作用
我正在部署 Percona Xtradb-Cluster 并陷入自动故障转移。当我在数据库中停止节点 2 时不会自动更新状态。这是日志:
2017-06-23 23:37:29 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:39 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:37:59 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过3 个心跳,回避它并杀死所有连接 2017-06-23 23:38:09 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,回避它并杀死所有连接2017-06-23 23:38:19 MySQL_Monitor.cpp:1126:monitor_ping():[错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:29 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过3 个心跳,回避它并杀死所有连接 2017-06-23 23:38:39 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,回避它并杀死所有连接2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168。 1.11:3306 错过了 3 个心跳,回避它并杀死所有连接monitor_ping(): [错误] 服务器 192.168.1.11:3306 错过了 3 个心跳,避开它并杀死所有连接 2017-06-23 23:38:49 MySQL_Monitor.cpp:1126:monitor_ping(): [错误] 服务器 192.168。 1.11:3306 错过了 3 个心跳,回避它并杀死所有连接
谢谢。
java - mysql故障转移后如何用从数据库的数据更新主数据库
我正在使用 Mysql Server 5.6。我已经设置了主从复制并且它工作正常。唯一的问题是,当我启动主服务器时,从属服务器的数据不会自动更新到主服务器。
azure - 从 Azure VM 故障转移到 Azure Web App
我们希望从Azure VM (Windows Server) 故障转移到Azure Web App。虚拟机托管 Web 应用程序,而 Web 应用程序只是一个通知网站维护中消息的页面。这适用于服务器的计划内/计划外维护事件。维护结束后,如何收回。提前致谢。
postgresql - PgPool-II 和 repmgr 自动故障转移
我有用于 HA 的 pgpool-II 和用于自动故障转移的 repmgr。Pgpool-II 也可以运行故障转移 我只是想知道使用 pgpool 或 repmgr 进行自动故障转移?如果 pgpool 可以进行故障转移,我是否需要使用 repmgr?并使用shell脚本来提升新主人?
mongodb - MongoDB 作为故障转移数据库
如果系统已经在运行 SQL Server,是否可以使用 NoSQL 数据库(特别是 MongoDb)作为 SQL Server 故障转移环境中的故障转移数据库?这样,如果主 SQL 节点发生故障,则运行/托管 MongoDb 的辅助节点将占据主要位置。
nginx - 当 nginx 服务关闭时,Pacemake 不会进行故障转移
我已经为 nginx 设置了 HA-Cluster。因此,当 nginx 或节点发生故障时,它将故障转移到第二个节点。
pcs status 集群名称:push_noti_cluster 堆栈:corosync 当前 DC:push2(版本 1.1.18-11.el7_5.3-2b07d5c5a9) - 具有仲裁的分区 最后更新:2018 年 7 月 31 日星期二 11:29:16 最后更改:2018 年 7 月 31 日星期二:20:05 2018 由 root 通过 cibadmin 在 push1 上
配置了 2 个节点 配置了 3 个资源
在线:[push1push2]
完整资源列表:
virtual_ip (ocf::heartbeat:IPaddr2): 开始 push1 克隆集: Nginx-clone [Nginx] 开始: [ push1 push2 ]
守护进程状态: corosync: active/enabled 起搏器: active/enabled pcsd: active/enabled 你有新邮件在 /var/spool/mail/root [root@server1 ~]#
当我们停止pcs cluster stop
在这些节点上使用集群服务或重新启动服务器时,故障转移工作正常。
我们想要实现的是在主机 node01 上的 nginx 停止运行并且资源 virtual_ip/webserver 都应该故障转移到第二个主机 node02 时执行资源故障转移。
是否可以进行服务级别故障转移?即当一个节点(node01)中的一个资源失败时,所有配置的资源(这里是virtual_ip/webserver)都应该故障转移到另一个节点(node02)。
sql-server - 使用 Azure SQL 的 Azure 自动故障转移组中的问题
我正在使用带有自动故障转移组的 Azure SQL,为此我创建了一个 SQL Server 和一个数据库,并在另一个 SQL Server 中创建了另一个数据库副本,该 SQL Server 是在其他区域的 Geo-Replication 的帮助下创建的。为此,我创建了一个故障转移组并且工作正常。但是在处理这个问题时,有人向我提出了一些疑问,例如:
我的主要区域(如美国东部)由于发生意外灾难而崩溃,那么我的 SQL 数据库和我所有的故障转移组状况如何。有可能恢复它们吗?
如果我删除主 SQL 数据库,那么我的故障转移组会发生什么情况?
- 如果我删除了我的主 SQL 服务器,那么我的故障转移组工作是否正常?
为了执行上述操作,我点击了链接
mysql - Sequelize 连接到故障转移写入副本
我正在使用 Sequelize 4.38.0。阅读文档后,我设置了一个包含 2 个只读副本的主写入数据库。我正在尝试为主写入数据库添加故障转移以实现高可用性。续集支持吗?在配置选项中,在“复制”中,您可以传递要读取的主机数组,但不能写入 =\
postgresql - PostgreSQL/PostDock:主节点中的自动恢复失败
我使用 Docker 服务和 Docker swarm 来部署 PostDock 集群
这是我的 docker-compose.yml 设置:
我跑:
一切顺利。
但是,在我多次更新服务后,主节点上的自动故障转移失败了。在主节点日志文件中,我注意到恢复过程无法检测到数据库 replication_db 和架构 replication_db.public:
如您所见,没有指定模式,只有点号“。” ,并且用户也错了:应该是replication_user,而不是用户public
这导致此错误消息:
据我了解,当自动故障转移成功时,预期的恢复日志应该是:
有人知道这个问题的根本原因吗?
azure - Azure SQL 故障转移组,宽限期是什么意思?
我目前正在阅读:https ://docs.microsoft.com/en-us/azure/sql-database/sql-database-auto-failover-group ,我很难理解自动故障转移策略:
默认情况下,故障转移组配置有自动故障转移策略。SQL 数据库服务在检测到故障并且宽限期到期后触发故障转移。系统必须验证由于影响的规模,SQL 数据库服务的内置高可用性基础架构无法缓解中断。如果您想从应用程序控制故障转移工作流程,您可以关闭自动故障转移。
在 ARM 模板中定义故障转移组时:
我像这样指定 readWriteEndpoint :
将 failoverWithDataLossGracePeriodMinutes 设置为 60 分钟。
这是什么意思?我在任何地方都找不到明确的答案。是不是意味着:
- 当我的主数据库所在的主区域发生中断时,读/写端点指向主数据库,并且仅在 60 分钟后故障转移到我的辅助数据库,该辅助数据库将成为新的主数据库。在 60 分钟内,读取我的数据的唯一方法是直接使用 readOnlyEndpoint 吗?或者
- 如果他们以某种方式可以检测到没有要同步的数据,我的读/写端点会立即打开
我认为它归结为:我是否必须手动进行故障转移,如果我检测到中断,如果我不关心数据丢失,但我希望能够写入我的数据库?
额外的问题:存在宽限期的原因是因为主服务器上可能存在未同步的数据,如果辅助服务器成为新的主服务器(如果我手动切换),这些数据将被覆盖或丢弃?
抱歉,我不能只回答一个问题。我读了很多书,我真的需要知道这一点。