根据 SRE 工作簿https://sre.google/workbook/non-abstract-design/
如果我们的日志分片进程将重复的日志条目发送到两个分片,即使 LogJoiner 失败(可能是因为它所在的机器出现故障),系统也可以继续全速执行并处理准确的结果。
我可以理解,与其等待节点恢复以处理由于节点崩溃而丢失的分片,Google 的方法是将相同的项目发送到两个分片,因此即使其中一个节点崩溃,其中至少一个也会处理它. 但是,大多数日志条目最终会被 LogJoiners 重复处理。没有提到 LogJoiner 如何对此进行重复数据删除。也是通过 Paxos IdRegistry 1吗?但我认为 IdRegistry 用于跨数据中心重复数据删除,但不适用于数据中心内。也没有提到在1中有两个分片的重复日志条目