2

我在 scylla 中有一个表,称之为“tablex”,在键空间“keyspacey”中,现在,我将数据从它加载到 Spark 中,我观察到大量的分区,挖掘我看到它使用的代码mean_partition_size,可以使用以下查询看到:

SELECT range_start, range_end, partitions_count, mean_partition_size FROM system.size_estimates WHERE keyspace_name = 'keyspacey' AND table_name = 'tablex';

tablex 有 586 行,每一行由时间戳、文本、文本、bigint 组成。

运行上面的查询,我得到了 256 行,都具有 partition_count=1 和 nean_partition_size=5960319812。

问题的原因可能是什么以及如何解决?

4

1 回答 1

5

看起来你遇到了这个错误:https ://github.com/scylladb/scylla/issues/3916

已在 Scylla 3.0 中修复 - 我们建议升级。升级指南位于https://docs.scylladb.com/upgrade/upgrade-opensource/upgrade-guide-from-2.3-to-3.0/

于 2019-01-28T19:35:08.243 回答