我正在使用以下命令按照有关Scaling Out Data Ingestion的说明进行操作:
find . -type f | xargs -n 1 -P 320 sh -c 'echo $0 `copy_to_distributed_table -C $0 table_name`'
我的集群有一个 master 和 8 个 worker,每个 worker 有两个 SSD。该表分布在 320 个分片中。
数据加载需要很长时间。平均插入率似乎约为每分钟 750k。这是正常的还是有办法加快速度?
我唯一能想到的是我启用了复制。是否应该关闭加载然后重置?