cassandra - 相同的数据存储在 Cassandra 的不同表中

Question

我正在使用 Cassandra 来存储大数据。

为了运行多个查询，恐怕我需要创建不同的表并将几乎相同的数据插入这些表中。

会不会影响性能？

我现在所做的是从队列中读取一条记录，将其推送到我在 Cassandra 中创建的五个表中。如果一张表的记录大约需要10M内存，那么五张表总共需要50M内存吗？有没有更好的方法在 Cassandra 中存储重复数据？

谢谢你。

score 0 · Accepted Answer

如果我创建多个主键，它总是抛出异常。

这是意料之中的，你不能有多个初级键。当您组合列以创建主键时，它称为复合（或复合）键。例子：

CREATE TABLE timeline (
  user_id varchar,
  tweet_id uuid,
  author varchar,
  body varchar,
PRIMARY KEY (user_id, tweet_id)); // PK consists of two columns!

对于您的数据模型，我会尝试以下方式：

CREATE TABLE timeline (
  user_id varchar,
  module varchar,
  host varchar,
  body varchar,
PRIMARY KEY (user_id, module, host));

cassandra - 相同的数据存储在 Cassandra 的不同表中

1 回答 1

Related

Reference