我想问你一些关于 apache kafka 和压缩主题的问题。我们想在 kafka 压缩主题上提供一些 PII 数据。我们想通过 tombstone 删除这个主题的数据。目前有多个问题需要我们验证我们的假设:
- 是否有其他公司通过像 KIP-354 建议的带有墓碑生成的压缩主题来满足 kafka 中的 gdpr 要求(遗忘权)https://cwiki.apache.org/confluence/display/KAFKA/KIP-354% 3A+Add+a+Maximum+Log+Compaction+Lag ?
- 我们的假设是否正确,只有当记录不在活动段文件中时才会触发压缩。所以在我们看来,kafka 文档需要修改,在 kafka 文档点 4.8 中添加:主题的 max.compaction.lag.ms 可以用来保证消息写入时间和时间之间的最大延迟消息变得有资格进行压缩。在这里它应该添加条件,我们要压缩的消息不应该在活动段文件中。这是 max.compaction.lag.ms 功能的错误还是设计的?我们目前还不确定。
- 是否仅在插入新消息后才触发压缩?或者是否还有一个压缩非活动段文件的异步过程?
感谢您的回答;-)