2

我一直在寻找 Apache kafka 以实现高级消费者(我不想玩消息,我只需要将数据放入 MongoDB)v0.8.1.1

我查看了以下链接,其中显示了有关如何实现消费者的非常详细的信息。

Apache Kafka 消费者 wiki 另一个 kafka 消费者

但是对于所有线程关闭后消费者如何重新启动,我仍然一无所知。例如,假设我有 4 个消费者线程正在运行,它们消耗了来自 kafka 代理的所有消息,所以一旦没有消息,所有消费者将什么也不做,在特定超时后它将被关闭,所以我不确定消费者是如何再次当 kafka 代理中有新消息时重新启动。

有人可以分享一些代码或至少对此有一些指示。还有一种方法可以让我们在一些回调方法中拥有我们的业务逻辑,当有消息而不是 while 循环时,它会被调用。

4

1 回答 1

3

我认为您可能误解了关机期间超时的使用。从理论上讲,无论这些事件之间的时间如何,您都在消耗无限的事件流,因此除非您正在更新代码或机器崩溃,否则您的 consuner永远不应关闭。在实际需要关闭消费者的情况下,10000 毫秒超时的作用是让 Kafka 消费者有足够的时间将其最后读取的偏移量写入 ZooKeeper,以便当消费者重新启动时,它将从它处理的最后一个偏移量恢复。这种消费者关闭通常发生在您的程序关闭时(可能捕获到 InterruptedException),而不仅仅是消费者。因此,当您的程序重新启动时,consuner 会重新启动。

编辑

我应该补充一点,Kafka 的ConsumerIterator遵循这种永无止境的消费模式的原因。迭代器的next方法将一直阻塞,直到它可以读取下一条消息。因此,达到示例中超时的唯一方法是消费者线程因某种异常而关闭。

编辑 2

我还没有看到任何支持回调的 Kafka 消费者 API 我认为您现在唯一的选择是编写自己的回调实现,例如:

public interface Callback {
  void call(MessageAndMetadata message);
}

Executor executor = Executors.newCachedThreadPool();
final Callback<byte[], byte[]> callback = new MyCallback();
while (it.hasNext()) {
  final MessageAndMetadata message = it.next();
  executor.submit(new Runnable() {
    public void run() {
      callback.call(message);
    }
  });
}

您可能对他们目前正在为 Kafka 0.9 重写消费者 API感兴趣,但我认为我没有在重写中看到回调(尽管我可能是错的)。

于 2015-03-31T20:00:29.363 回答