Apache Samza 使用 RocksDB 作为本地存储的存储引擎。这允许有状态的流处理,这里有一个很好的概述。
我的用例:
- 我有多个事件流,我希望从 Apache Kafka 等系统中获取这些事件流。
- 这些事件创建状态 - 我希望跟踪的状态基于以前收到的消息。
- 我希望根据计算的状态生成新的流事件。
- 输入流事件高度连接,OrientDB / Neo4J 等图形是查询数据以创建新流事件的理想媒介。
我的问题:
是否可以使用非 KV 存储作为 Samza 的本地存储?有没有人用 OrientDB / Neo4J 做过这个,有人知道一个例子吗?