谷歌云提供了使用 Hadoop 的连接器。( https://cloud.google.com/hadoop/google-cloud-storage-connector )
使用连接器,我从 hdfs 接收数据到谷歌云存储
前任)
hadoop discp hdfs://${path} gs://${path}
但数据太大(16TB),接收速度只有 2mb/s
所以,我尝试更改设置 distcp (地图属性,带宽属性...)
不过速度是一样的。
将数据从 HDFS 传输到 Google Cloud Storage 时如何加快 distcp