我们一直在一个 3 代理集群中使用 Kafka,总共大约有 85 个分区,其中大部分是复制因子 3。我们还一直在使用 JMX 导出器来收集集群上的指标。
我们最近注意到,当一个代理出现故障时,指标中报告的“分区计数”对于其他两个节点来说会上升。
我的理解是,当一个 Broker 宕机时,ISR 将会丢失,并且会重新选举领导者,但不应在其他两个 Broker 上创建任何新内容。当另一个经纪人失败时,经纪人为什么会报告该指标超过 100+ 的任何原因?
我们一直在一个 3 代理集群中使用 Kafka,总共大约有 85 个分区,其中大部分是复制因子 3。我们还一直在使用 JMX 导出器来收集集群上的指标。
我们最近注意到,当一个代理出现故障时,指标中报告的“分区计数”对于其他两个节点来说会上升。
我的理解是,当一个 Broker 宕机时,ISR 将会丢失,并且会重新选举领导者,但不应在其他两个 Broker 上创建任何新内容。当另一个经纪人失败时,经纪人为什么会报告该指标超过 100+ 的任何原因?