5

我有一个要求,我需要我的数据库来存储以下数据:

- For each build, store the results of 3 performance runs. The result includes tps and latency. 

阅读 cassandra 数据模型,这直接映射到以下格式的超级列族:

BenchmarkSuperColumnFamily= {

build_1: {
   Run1: {1000K, 0.5ms}
   Run2: {1000K, 0.5ms}
   Run3: {1000K, 0.5ms}
}

build_2: {
   Run1: {1000K, 0.5ms}
   Run2: {1000K, 0.5ms}
   Run3: {1000K, 0.5ms}
}
...

}

但是,我在以下答案中读到不鼓励使用 Super Column 系列。我想知道是否有更好的方法来为我的要求创建模型。

PS,我从下面的文章中借用了 JSONish 表示法

4

1 回答 1

6

您链接到的 StackOverflow 答案是正确的。您不应该在新应用程序中使用 SuperColumns。然而,它们的存在是为了向后兼容。

通常,复合柱可用于模拟超级柱提供的任何模型。基本上,它们允许您将列名分成多个部分。因此,如果您要指定“CompositeType(UTF8Type, UTF8Type)”的比较器,您的数据模型最终会如下所示:

BenchmarkColumnFamily= {

   build_1: {
       (Run1, TPS) : 1000K
       (Run1, Latency) : 0.5ms
       (Run2, TPS) : 1000K
       (Run2, Latency) : 0.5ms
       (Run3, TPS) : 1000K
       (Run3, Latency) : 0.5ms
    }

    build_2: {
       ...
    }
...

}

使用上述模型,您可以使用单个查询来获取单次运行的单个数据点、单次运行的所有数据点或多次运行的所有数据点。

有关复合列的更多信息: http ://www.datastax.com/dev/blog/introduction-to-composite-columns-part-1

于 2012-06-26T04:12:25.323 回答