我正在开发一个原型Lambda 系统,我的数据通过 Flume 流式传输到 HDFS。我还需要将数据导入 Storm。Flume 是一个推送系统,而 Storm 更具有拉力,所以我认为尝试将一个 spout 连接到 Flume 并不明智,但我认为两者之间应该有一个消息队列。同样,这是一个原型,所以我正在寻找最佳实践,而不是完美。我正在考虑将符合 AMQP 的队列作为 Flume 接收器,然后从 spout 中提取消息。
这是一个好方法吗?如果是这样,我想使用在 Flume 世界(作为接收器)和 Storm 世界(作为 spout)中都具有相对强大支持的消息队列。如果我使用 AMQP,那么我假设这让我可以选择使用我想使用的任何符合 AMQP 的队列,对吗?谢谢。