0

我正在使用 Cassandra 来存储大数据。

为了运行多个查询,恐怕我需要创建不同的表并将几乎相同的数据插入这些表中。

会不会影响性能?

我现在所做的是从队列中读取一条记录,将其推送到我在 Cassandra 中创建的五个表中。如果一张表的记录大约需要10M内存,那么五张表总共需要50M内存吗?有没有更好的方法在 Cassandra 中存储重复数据?

谢谢你。

4

1 回答 1

0

如果我创建多个主键,它总是抛出异常。

这是意料之中的,你不能有多个初级键。当您组合列以创建主键时,它称为复合(或复合)键。例子:

CREATE TABLE timeline (
  user_id varchar,
  tweet_id uuid,
  author varchar,
  body varchar,
PRIMARY KEY (user_id, tweet_id)); // PK consists of two columns!

对于您的数据模型,我会尝试以下方式:

CREATE TABLE timeline (
  user_id varchar,
  module varchar,
  host varchar,
  body varchar,
PRIMARY KEY (user_id, module, host));
于 2013-07-08T11:19:42.737 回答