1

我正在使用 python 程序将 250 万条记录写入 Cassandra。程序完成很快,但在查询数据时,记录会在很长一段时间后反映。记录的数量逐渐增加,似乎数据库正在以队列方式执行对表的写入。写入继续进行,直到所有记录完成。为什么写反映迟?

4

1 回答 1

1

通常提供一个最小的代码示例以及复制问题的步骤,但您没有提供太多信息。

我的猜测是您已经发出了很多异步写入,这意味着这些查询会排队,因为这就是异步编程的工作方式。在它们最终到达集群并得到处理之前,您将无法立即看到结果。

此外,您还没有提供有关如何验证数据的信息,因此我将做出另一个猜测,并说您正在做一个SELECT COUNT(*)需要在 Cassandra 中进行全表扫描的操作。鉴于您已发出数百万次写入,节点可能会超载并需要一段时间才能响应。

对于它的价值,如果你正在做一个COUNT()你可能会对这篇文章感兴趣,我已经解释了为什么在 Cassandra 中这样做是不好的——https: //community.datastax.com/questions/6897/。干杯!

于 2021-07-20T13:01:55.867 回答