我正在使用 s3disctcp 将 31,16,886 个文件(300 GB)从 S3 复制到 HDFS,仅复制 10,48,576 个文件需要 4 天。我终止了工作,需要了解如何减少这个时间或我在做什么错误的。
s3-dist-cp --src s3://xml-prod/ --dest hdfs:///Output/XML/
它在 AWS EMR 机器上。
我正在使用 s3disctcp 将 31,16,886 个文件(300 GB)从 S3 复制到 HDFS,仅复制 10,48,576 个文件需要 4 天。我终止了工作,需要了解如何减少这个时间或我在做什么错误的。
s3-dist-cp --src s3://xml-prod/ --dest hdfs:///Output/XML/
它在 AWS EMR 机器上。