我使用 Kafka 进行消息队列/处理。我的问题是关于性能/最佳实践。我会做自己的性能测试,但也许有人已经有了结果/经验。
数据是 Kafka (0.10) 主题中的原始数据,我想将其结构化传输到 ES 和 HDFS。
现在我看到了两种可能性:
- Logstash(Kafka 输入插件、grok 过滤器(解析)、ES/webhdfs 输出插件)
- Kafka Streams(解析)、Kafka Connect(ES sink、HDFS sink)
如果没有任何测试,我会说第二种选择更好/更清洁,更可靠?