Cassandra 没有上限集合(或行大小限制),但模拟它的一种方法是使用离线 mapreduce 作业清理额外条目。有第二个表来存储另一个表中主键的行数会更好吗?缺点是您必须扫描整个 row_count 表,因为计数器不可索引。或者用真实数据扫描后备表会更快吗?
还是我应该研究另一种技术?
编辑:我发现这个Columns count vs counter column performance。行数会遍历所有数据,所以我倾向于远离这一点。
Cassandra 没有上限集合(或行大小限制),但模拟它的一种方法是使用离线 mapreduce 作业清理额外条目。有第二个表来存储另一个表中主键的行数会更好吗?缺点是您必须扫描整个 row_count 表,因为计数器不可索引。或者用真实数据扫描后备表会更快吗?
还是我应该研究另一种技术?
编辑:我发现这个Columns count vs counter column performance。行数会遍历所有数据,所以我倾向于远离这一点。