我正在处理超过 200,000 个 netcdf 文件,每个文件为 17 MB。它们都在谷歌云存储桶中,我正在尝试找到一种使用 gcsfuse 增加吞吐量的方法。
我正在使用谷歌云计算引擎虚拟机和 gcsfuse 来访问文件。我查看了 gsutil,但在 Google Cloud 文档中读到“单个 I/O 流的运行速度大约与 gsutil 一样快”。使用 gcsfuse 的 NCL 脚本将需要 8 天以上,这太长了。关于如何提高吞吐量的任何建议?谢谢你。
我正在处理超过 200,000 个 netcdf 文件,每个文件为 17 MB。它们都在谷歌云存储桶中,我正在尝试找到一种使用 gcsfuse 增加吞吐量的方法。
我正在使用谷歌云计算引擎虚拟机和 gcsfuse 来访问文件。我查看了 gsutil,但在 Google Cloud 文档中读到“单个 I/O 流的运行速度大约与 gsutil 一样快”。使用 gcsfuse 的 NCL 脚本将需要 8 天以上,这太长了。关于如何提高吞吐量的任何建议?谢谢你。
优化传输性能您必须考虑: