通读文档(http://snappydatainc.github.io/snappydata/streamingWithSQL/)并对此项目有疑问:
“通过共同分区减少混洗:使用 SnappyData,输入队列(例如,用于 Kafka 源)、流处理器和底层存储使用的分区键都可以相同。这大大减少了混洗记录的需要。”
如果我们使用 Kafka 并使用键(单个值)将我们的数据分区到一个主题中。是否可以将这个单个键从 kafka 映射到 snappy 表中标识的多个分区键?
是否有某种散列可以将多个键变成一个键?
减少洗牌的好处似乎很重要,并试图在这里了解最佳实践。
谢谢!