apache-spark - 弹性搜索无法写入所有条目：可能是es超载了

Question

我有一个应用程序，我在其中读取 csv 文件并进行一些转换，然后将它们从 spark 本身推送到弹性搜索。像这样

input.write.format("org.elasticsearch.spark.sql")
              .mode(SaveMode.Append)
              .option("es.resource", "{date}/" + type).save()

我有几个节点，在每个节点中，我运行 5-6 个spark-submit推送到elasticsearch

我经常收到错误

Could not write all entries [13/128] (Maybe ES was overloaded?). Error sample (first [5] error messages):
        rejected execution of org.elasticsearch.transport.TransportService$7@32e6f8f8 on EsThreadPoolExecutor[bulk, queue capacity = 200, org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor@4448a084[Running, pool size = 4, active threads = 4, queued tasks = 200, completed tasks = 451515]]

我的 Elasticsearch 集群具有以下统计信息 -

Nodes - 9 (1TB space,
Ram >= 15GB ) More than 8 cores per node

我已经修改了 elasticseach 的以下参数

spark.es.batch.size.bytes=5000000
spark.es.batch.size.entries=5000
spark.es.batch.write.refresh=false

任何人都可以建议，我可以解决什么来摆脱这些错误？

score 5 · Accepted Answer

发生这种情况是因为批量请求的传入速率大于 elasticsearch 集群可以处理的速率，并且批量请求队列已满。

默认批量队列大小为 200。

理想情况下，您应该在客户端处理此问题：

1) 通过减少同时运行的 spark-submit 命令的数量

2) 在被拒绝的情况下通过调整es.batch.write.retry.count和重试es.batch.write.retry.wait

例子：

es.batch.write.retry.wait = "60s"
es.batch.write.retry.count = 6

在弹性搜索集群方面：

1）检查每个索引是否有太多分片并尝试减少它。
该博客对调整分片数量的标准进行了很好的讨论。

2）作为最后的手段增加thread_pool.index.bulk.queue_size

查看此博客，其中包含有关批量拒绝的广泛讨论。

score 0 · Accepted Answer

ES 集群中的批量队列正在达到其容量 (200) 。尝试增加它。有关如何更改批量队列容量的信息，请参阅此页面。

https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-threadpool.html

还要检查这个其他 SO 答案，其中 OP 有一个非常相似的问题，并通过增加批量池大小来修复。

org.elasticsearch.transport.TransportService 错误的拒绝执行

apache-spark - 弹性搜索无法写入所有条目：可能是es超载了

2 回答 2

Related

Reference