我在 Cassandra 有一张桌子,实际上不是很大。只有 50k 行。我需要从该表中流式传输所有行并在 Elasticsearch 中对它们进行索引。
我使用以下方法在 Node.js 中编写了一个简单的脚本:
var myStream = CassandraService.cassandra_client.stream("select * from my_table");
然后开始监听data
事件,创建 1000 行的批量请求,暂停流,索引行并取消暂停流。
这适用于 1000-2000 行。但是现在由于表大小已经增长到 50000 行,我query time out error
在从 Cassandra 获取时得到了。
Unhandled rejection ResponseError: Operation timed out - received only 0 responses.
所以这个过程甚至没有开始。解决此问题的推荐方法是什么?