2

是否可以通过在 Spark Streaming 应用程序中处理 Kafka 主题来实现一次?

要实现恰好一次,您需要以下内容:

  1. 卡夫卡生产者到卡夫卡经纪人的一次。这是由 Kafka 的 0.11 幂等生产者实现的。但是 Kafka 0.11 到 Spark Streaming 的集成生产准备好了吗?我发现这张 JIRA 票有很多错误。
  2. 在 Kafka 代理到 Spark Streaming 应用程序上恰好有一次。能实现吗?由于 Spark Streaming 应用程序故障,应用程序可以读取某些数据两次,对吗?作为解决方案,我可以将计算结果和最后处理的事件 uuid 保存到 Redis 事务吗?
  3. 通过 Spark Streaming 应用程序转换数据仅一次。这是 RDD 的开箱即用属性。
  4. 仅在持久结果上出现一次。在第二条语句中通过将最后一个事件 uuid 持久保存到 Redis 来解决。
4

0 回答 0