我想知道在单个磁盘故障的情况下 Yugabyte 的行为是什么。具体来说:
系统管理员在处理单个磁盘故障时应该遵循什么程序?例如,是否暂时停止 TServer、更改磁盘并重新启动它会自动从其他 TServer 复制该磁盘的平板电脑?
如果在规定的时间范围内没有更换故障磁盘,TServer 是否会自动检测磁盘故障并将该磁盘上的数据传播到其他磁盘?
谢谢你。
我想知道在单个磁盘故障的情况下 Yugabyte 的行为是什么。具体来说:
系统管理员在处理单个磁盘故障时应该遵循什么程序?例如,是否暂时停止 TServer、更改磁盘并重新启动它会自动从其他 TServer 复制该磁盘的平板电脑?
如果在规定的时间范围内没有更换故障磁盘,TServer 是否会自动检测磁盘故障并将该磁盘上的数据传播到其他磁盘?
谢谢你。
系统管理员在处理单个磁盘故障时应该遵循什么程序?例如,是否暂时停止 TServer、更改磁盘并重新启动它会自动从其他 TServer 复制该磁盘的平板电脑?
是的,以下过程有效,YugabyteDB 将识别数据丢失并重建数据:
yb-ctl
如果您想了解此行为,您可以在笔记本电脑上的类似沙盒的环境中尝试此操作。设置/过程与此容错实验相同。而不是删除节点,只是stop
一个节点,删除一个或多个“磁盘”(实际上只是目录)并将start
节点返回。我相信默认情况下会创建两个磁盘。
这是yb-ctl
.
PS:如果您正在做这个练习,请考虑为docs 的容错部分做出贡献,如果您有兴趣,我们很乐意为您提供帮助。
如果在规定的时间范围内没有更换故障磁盘,TServer 是否会自动检测磁盘故障并将该磁盘上的数据传播到其他磁盘?
是的,如果有足够的其他节点可以复制数据,这会自动完成。例如: