据我了解,Redshift 是为性能而不是可用性而构建的。文档https://aws.amazon.com/redshift/faqs/ 建议一旦任何节点关闭,整个集群都会关闭,直到节点恢复。在 AZ 故障的情况下,您根本没有运气。
这篇文章建议有一个双集群 https://aws.amazon.com/blogs/big-data/building-multi-az-or-multi-region-amazon-redshift-clusters/ 但是,我不清楚如何您是否复制 Looker 的 PDT 表以支持通过 Route 53 到备用集群的即时故障转移?
只是好奇人们如何解决 Redshift 上的 HA 问题?