我目前正在尝试导入包含约 7300 张图像的单标签数据集。我使用以下格式的单个 CSV 文件来创建数据集(路径缩短):
gs://its-2018-40128940-automl-vis-vcm/[...].jpg,CAT_00
gs://its-2018-40128940-automl-vis-vcm/[...].jpg,CAT_00
gs://its-2018-40128940-automl-vis-vcm/[...].jpg,CAT_00
[...]
但是,导入过程在处理超过 7 个小时(根据以前的经验我发现异常长)后失败,并出现以下错误:
File unreadable or invalid gs://[...]
奇怪的是:文件在那里,我可以在我的机器上下载和查看它们。一旦我从 CSV 中删除了所有条目,除了两个“不可读或无效”的条目并导入了这个 CSV 文件(同一个桶),它就像一个魅力,只花了几秒钟。
另一个包含 500 张其他图像的数据集导致了同样的奇怪行为。
我之前已经导入并训练了一些 AutoML Vision 模型,但这次我不知道出了什么问题。任何想法或调试技巧表示赞赏。GCP 项目是“its-2018-40128940-automl-vis”。
提前致谢!