我有一个 cassandra 集群,其行数相当少(200 万左右,我希望这对于 cassandra 来说是“小”)。每行都以唯一的 UUID 为键,每行大约有 200 列(给或取几列)。总而言之,这些都是非常小的行,没有二进制数据或大量文本。只是短字符串。
我刚刚完成了从旧数据库到 cassandra 集群的初始导入。我已经在每台机器上调整了 cassandra。有数亿次写入,但没有读取。现在是时候使用这个东西了,我发现读取速度绝对令人沮丧。我正在一次使用 pycassa 在 500 到 10000 行的任何地方进行 multiget。即使在 500 行时,性能也很糟糕,有时需要 30 多秒。
什么会导致这种行为?在像这样的大量进口之后,你会推荐什么样的东西?谢谢。