我正在使用 Kafka 作为缓冲系统在 Apache NiFi 中创建数据摄取工作流。我有一个运行相同工作流的 3 节点集群,每个节点有 4 个核心。
我依赖于多个将数据移入和移出不同 Kafka 主题的实例,这是工作流中最慢的部分,并且在性能方面非常不一致,因为两个相同的测试最多可以增加 100% 的持续时间。
我们的发布和消费 Kafka 处理器在所有三个节点上运行,我们的 Kafka 主题在三个代理之间有 3 个分区。
有没有人知道什么会导致这种不一致以及我可以做些什么来减轻它并加快工作流程?