3

我在一个大型博客处理项目中工作apache Cassandra,但我想知道列族中是否有太多行。这会使我的查询变慢吗?

在我的数据中,我们每天有大约 1000 亿行日志

如果我将它们分成许多列族(如 20120627 之类的日模式)更好?

任何人都可以给我一个建议来建模这些数据?

我打算只创建这样的列族:

CREATE TABLE data (
  KEY text PRIMARY KEY
) WITH
  comment='log' AND
  comparator=text 

我想以时间戳处理数据(前处理:10:20 --> 10:30 数据)

4

1 回答 1

1

我认为您不必创建许多列族,而是使用复合键并使用列。

密钥的格式可以是(一天中的日期:日志的时间戳)或(一天中的小时:日志的时间戳)或(一天中的分钟:日志的时间戳)

然后,为了防止与具有相同时间戳的日志发生冲突,您可以使用超级列。

您可以获取有关 cassandra 限制的更多信息:http ://wiki.apache.org/cassandra/Cas​​sandraLimitations

于 2012-06-28T10:23:47.123 回答