问题标签 [automatic-failover]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - kubernetes (vmware) 上的 MYSQL HA
我已经按照 https://kublr.com/blog/setting-up-mysql-replication-clusters-in-kubernetes-2/设置了 MYSQLHA,有两个节点启动并准备好能够在每个节点上部署 pod 并从中复制数据在几秒钟内从主到从。1 主节点 2 从节点 VMWARE ESXi 设置 3 虚拟机在单独的子网上
我也有 NFS 共享设置以防万一。
参考:- https://kublr.com/blog/setting-up-mysql-replication-clusters-in-kubernetes-2/
如何执行自动故障转移和扩展?
sql-server - 查明 AlwaysOn 可用性组中上次故障转移的时间
我使用下面提到的查询来确定过去 30 分钟内是否发生了任何故障转移
但是由于“扩展事件中的事件时间戳不正确”,我没有得到我期望的结果。
在 SSMS --> 管理--> 扩展事件--> 会话--> AlwaysOn_health--> 单击事件文件。
在那个事件文件中,
在 MSSQL 日志文件夹中 --> "AlwaysOn_health" 文件中的可用性_replica_state_change 时间
(1) 和 (2) 中的时间戳必须相同。
但对我来说,它的展示时间不同。所以我没有得到正确的结果。
是否有任何查询可以读取 MS SQL 错误日志,而不是使用扩展事件?
是否有任何查询可查明过去 30 分钟内是否发生了故障转移?
请帮我找到解决方案。
java - 故障转移后恢复连接,因为 HikariCP 未检测到数据库 DNS 更改
环境
Hikari CP 版本:3.4.1
JDK 版本:1.8.0_251
数据库:Azure SQL
SpringBoot 版本:2.2.2 RELEASE
MS-SQL JDBC 驱动程序版本:- 8.4.1-jre8
我正在开发一个 Spring Boot 应用程序,我需要配置数据库的自动故障转移,并且我们正在利用 Azure 故障转移组。应用程序连接到主数据库,当主服务器的手动故障转移完成后,应用程序应该连接到辅助服务器,该辅助服务器现在是新的主服务器。
下面是我的 JDBC 连接字符串和 Hikari 属性:
应用启动后,分析如下:
- Hikari 在池中有一个有效的连接
- Spring JPA Transaction 从池中拉取连接
- 数据成功保存在数据库中
- 接下来,手动故障转移完成
- txn.begin(),抛出异常
- 破管写入失败异常
- 连接已关闭(SQLServerException:连接已关闭)
- 连接保持关闭直到应用程序运行
期望:
由于pool已经进入bad state,关闭后的连接应该被恢复并连接到新的主数据库作为备份
有谁知道如何重新建立关闭的连接以自动重新连接到备份数据库。
apache-spark - Zookeeper 领导者自动故障转移
我们在 HA 模式下使用 spark 独立集群 3 zookeepers。我在 zookeeper.log 中看到了这个问题。
由于 java.io.IOException 导致会话 0x0 关闭的异常:Len 错误 1195725856 Closed socket connection for client /10.23 ......(没有为客户端建立会话)
Zookeeper 领导者正在从一台服务器自动故障转移到另一台服务器,因此随后,spark master 正在自动故障转移,此外,一些客户端因此错误而不断断开/重新连接。怎么修
完整日志:
[myid:3] - WARN [NIOServerCxn.Factory:0.0.0.0/0.0.0.0:2181:NIOServerCnxn@354] - 由于 java.io.IOException 导致会话 0x0 关闭的异常:Len 错误 1195725856
[myid:3] - 信息 [NIOServerCxn.Factory:0.0.0.0/0.0.0.0:2181:NIOServerCnxn@1001] - 客户端 /10 的关闭套接字连接......(没有为客户端建立会话)
[myid:3] - 错误 [LearnerHandler-/159.1.......:LearnerHandler@562] - 在 sock 仍然打开时导致关机的意外异常
[myid:3] - 警告 [LearnerHandler-/159.1......:LearnerHandler@575] - ******* GOODBYE /159.1..... ********
[myid:3] - 信息 [WorkerReceiver[myid=3]:FastLeaderElection@542] - 通知:1 (n.leader), 0x29000000ed (n.zxid), 0xa (n.round), LOOKING (n.state), 1 (n.sid), 0x29 (n.peerEPoch), LEADING (我的州)
[myid:3] - 信息 [LearnerHandler-/159........:LearnerHandler@263] - 追随者 sid: 1 : info : org.apache.zookeeper.server.quorum.QuorumPeer$QuorumServer@e144103
[myid:3] - 信息 [LearnerHandler-/159.......LearnerHandler@318] - 与追随者 sid 同步:1 maxCommittedLog=0x29000000ed minCommittedLog=0x2800000007 peerLastZxid=0x29000000ed
[myid:3] - 信息 [LearnerHandler-/159.......:LearnerHandler@395] - 发送 DIFF
amazon-web-services - AWS 中的多租户、区域驻留和区域故障转移
对于在 AWS 上构建多租户 SAAS 无服务器应用程序,这是我们计划管理“用户”和多租户的方式。相关博客文章:https ://medium.com/@tarekbecker/serverless-enterprise-grade-multi-tenancy-using-aws-76ff5f4d0a23
为了确保业务连续性,我们还希望确保
- 区域故障转移
- 个人身份信息的数据驻留
- 灾难恢复
为了将这些方面集成到无服务器应用程序中,应在以下架构中进行哪些更改?
postgresql - 我可以在没有见证节点的情况下使用 EDB postgres 故障转移管理器 >
我有一个启用了 EDB 流复制的主节点和一个备用节点。我想使用 EDB 故障转移管理器工具。但是我没有任何见证节点。如果我在没有见证节点的情况下进行故障转移管理器设置,有什么方法可以将备用节点用作见证节点或它将如何工作。?
pgpool - pgpool 的自动故障转移问题
我已经使用 pgpool 设置了一个 3 节点集群,其中一个节点充当主节点,其他 2 个节点保持备用。我面临的问题是 DELEGATE_IP / VIP 在从 PRIMARY 到 STANDBY 的故障转移期间没有转移控制权。我能够通过 VIP、主机和端口连接到主数据库,并且 HA 正在复制到备用数据库。但理想情况下,我希望 pgpool 在故障转移期间降级旧的 MASTER 并提升/选择新的 MASTER 节点(来自备用服务器之一)。但这并没有发生。有人可以让我知道需要在 pgpool.conf 或任何其他配置文件中设置的所有参数以使自动故障转移成功发生吗?我的 pgpool 配置文件超过 1000 行,所以我们需要检查的任何特定参数,请告诉我。
提前致谢, Ruthran G
cluster-computing - 如何将服务拆分为在 2 个节点上运行?
大家好
,我有这个问题,应该解决。
我有 2 个节点正在运行,我有 3 个服务应该在节点 1 上运行,2 个服务应该在节点 2 上运行
所以当应用hastart所有在 node1 上运行的服务时,我不想要这个。我想为每个服务指定首选节点。请问我如何编辑 main.cf 或有另一个配置文件,我应该
从 main.cf 调整以下行,我希望服务组应用程序在节点 2 上运行。
请您对此给予支持。
c# - 使用 Azure 地理冗余 (RA-GRS) 表存储时,如何更新 ASP.NET Core 中的 TableServiceClient 以指向次要区域?
我正在使用最新的Azure.Data.Tables
nuget 包版本12.3.0
连接到 ASP.NET Core C# 应用程序中的 Azure 表存储。
如果主要区域发生故障,我的应用程序需要故障转移到次要区域进行读取。
目前的设置TableServiceClient
是在 Startup.cs 中完成的,如下所示:
如何TableServiceClient
使用指向次要区域的实例更新当前实例?是否有更好的方法来实现此故障转移?
澄清一下:我知道客户端不支持故障转移,并且团队已经创建了一张票以在将来查看此功能。我意识到我需要一个新的TableServiceClient
.
我只是不确定如何将启动时创建的替换为失败时指向辅助实例的新实例。
这是消耗TableServiceClient