nosql - Cassandra 的列族中有多少行会影响性能？

Question

我在一个大型博客处理项目中工作apache Cassandra，但我想知道列族中是否有太多行。这会使我的查询变慢吗？

在我的数据中，我们每天有大约 1000 亿行日志

如果我将它们分成许多列族（如 20120627 之类的日模式）更好？

任何人都可以给我一个建议来建模这些数据？

我打算只创建这样的列族：

CREATE TABLE data (
  KEY text PRIMARY KEY
) WITH
  comment='log' AND
  comparator=text

我想以时间戳处理数据（前处理：10:20 --> 10:30 数据）

score 1 · Accepted Answer

我认为您不必创建许多列族，而是使用复合键并使用列。

密钥的格式可以是（一天中的日期：日志的时间戳）或（一天中的小时：日志的时间戳）或（一天中的分钟：日志的时间戳）

然后，为了防止与具有相同时间戳的日志发生冲突，您可以使用超级列。

您可以获取有关 cassandra 限制的更多信息：http ://wiki.apache.org/cassandra/CassandraLimitations

1 回答 1