下载一个包含 90000 个文件的 48GB 数据集需要 1 小时。我正在使用计算目标 p100-nc6s-v2 在 Azure ML 管道上训练图像分割模型。在我的脚本中,我使用 DataReference 的 as_download() 功能访问 Azure Blob 存储。Blob 存储与工作空间位于同一位置(使用 get_default_datastore)。
注意:我可以在几分钟内使用az copy
.
当我尝试使用 as_mount() 时,第一个时期非常慢(4700 秒,而后续时期为 772 秒)。
这是预期的行为吗?如果没有,可以做些什么来提高数据集加载速度?