我在一个大型博客处理项目中工作apache Cassandra
,但我想知道列族中是否有太多行。这会使我的查询变慢吗?
在我的数据中,我们每天有大约 1000 亿行日志
如果我将它们分成许多列族(如 20120627 之类的日模式)更好?
任何人都可以给我一个建议来建模这些数据?
我打算只创建这样的列族:
CREATE TABLE data (
KEY text PRIMARY KEY
) WITH
comment='log' AND
comparator=text
我想以时间戳处理数据(前处理:10:20 --> 10:30 数据)