我在 hive 中创建了一个外部表,需要将数据移动到 ES(2 个节点,每个节点 1 TB)。对于具有 9GB 数据的源表,以下常规查询需要很长时间(超过 6 小时)。
INSERT INTO TABLE <ES_DB>.<EXTERNAL_TABLE_FOR_ES>
SELECT COL1, COL2, COL3..., COL10
FROM <HIVE_DB>.<HIVE_TABLE>;
ES 索引具有默认的 5 个分片和 1 个副本。增加分片的数量可以加快摄取速度吗?有人可以提出任何改进以加快 ES 节点摄取。