我在 1-7 天后的时间序列数据TTLs
(取决于用例)。数据是不可变的,并按时间戳 ( cluster by timestamp
) 排序 - 数据在“写入时”加盖时间戳(因此新数据时间戳应始终是渐进式的)
分区大小不应超过 10K 项目 - 通常要少得多(最多10MB
为 10k 项目)。
我没有找到任何关于如何配置压缩策略(要考虑哪些参数)的好的文档,所以我决定这样做:
compaction = {'class': 'TimeWindowCompactionStrategy', 'compaction_window_size': '7', 'compaction_window_unit': 'DAYS'}
绝对不确定这是正确的
KPI
我应该考虑什么?