Nifi 和 Kafka 现在都可以在 Cloudera 数据平台、CDP 公有云中使用。Nifi 擅长与一切对话,而 Kafka 是主流的消息总线,我只是想知道:
在 CDP 公共云中从 Apache Nifi 向 Kafka 生产/消费数据所需的最少步骤是什么
理想情况下,我会寻找适用于任何云的步骤,例如 Amazon AWS 和 Microsoft Azure。
我对遵循最佳实践并使用平台默认配置的答案感到满意,但如果有常见的替代方案,这些也是受欢迎的。
Nifi 和 Kafka 现在都可以在 Cloudera 数据平台、CDP 公有云中使用。Nifi 擅长与一切对话,而 Kafka 是主流的消息总线,我只是想知道:
理想情况下,我会寻找适用于任何云的步骤,例如 Amazon AWS 和 Microsoft Azure。
我对遵循最佳实践并使用平台默认配置的答案感到满意,但如果有常见的替代方案,这些也是受欢迎的。
未来将有多种外形尺寸可用,现在我假设您的环境包含 1 个带有 NiFi 的数据中心和 1 个带有 Kafka 的数据中心。(如果两者都在同一个数据集线上,答案仍然有效)。
除非另有说明,否则我将所有内容都保留为默认设置。
在 Kafka 数据中心集群中:
broker1.abc:9093,broker2.abc:9093,broker3.abc:9093
在 NiFi GUI 中:
GenerateFlowFile
处理器PublishKafka_2_0
,配置如下:GenerateFlowFile
到您的PublishKafka_2_0
处理器并启动流程这些是最少的步骤,更详细的解释可以在Cloudera 文档中找到。请注意,最佳实践是显式创建主题(此示例利用 Kafka 的特性,即在生成主题时自动创建主题)。
一个很好的检查是查看数据是否写入 Kafka,然后再次使用它。
在 NiFi GUI 中:
ConsumeKafka_2_0
,配置它的Properties如下:就是这样,在 30 秒内,您应该会看到您发布到 Kafka 的数据现在再次流入 NiFi。
完全披露:我是 Nifi 背后的驱动力 Cloudera 的员工。