我正在使用 Cassandra 来存储大数据。
为了运行多个查询,恐怕我需要创建不同的表并将几乎相同的数据插入这些表中。
会不会影响性能?
我现在所做的是从队列中读取一条记录,将其推送到我在 Cassandra 中创建的五个表中。如果一张表的记录大约需要10M内存,那么五张表总共需要50M内存吗?有没有更好的方法在 Cassandra 中存储重复数据?
谢谢你。
我正在使用 Cassandra 来存储大数据。
为了运行多个查询,恐怕我需要创建不同的表并将几乎相同的数据插入这些表中。
会不会影响性能?
我现在所做的是从队列中读取一条记录,将其推送到我在 Cassandra 中创建的五个表中。如果一张表的记录大约需要10M内存,那么五张表总共需要50M内存吗?有没有更好的方法在 Cassandra 中存储重复数据?
谢谢你。
如果我创建多个主键,它总是抛出异常。
这是意料之中的,你不能有多个初级键。当您组合列以创建主键时,它称为复合(或复合)键。例子:
CREATE TABLE timeline (
user_id varchar,
tweet_id uuid,
author varchar,
body varchar,
PRIMARY KEY (user_id, tweet_id)); // PK consists of two columns!
对于您的数据模型,我会尝试以下方式:
CREATE TABLE timeline (
user_id varchar,
module varchar,
host varchar,
body varchar,
PRIMARY KEY (user_id, module, host));