0

我正在尝试使用 Cloud AI Platform 进行培训(gcloud ai-platform 作业提交培训)。我创建了我的存储桶并确定训练文件在那里(gsutil ls gs://sat3_0_bucket/data/train_input.csv)。

但是,我的工作因日志消息而失败:

File "/root/.local/lib/python3.7/site-packages/ktrain/text/data.py", line 175, in texts_from_csv
    with open(train_filepath, 'rb') as f:
FileNotFoundError: [Errno 2] No such file or directory: 'gs://sat3_0_bucket/data/train_input.csv'

我错过了什么吗?

4

1 回答 1

0

该错误可能正在发生,因为ktrain尝试自动检测使用的字符编码,open(train_filepath, 'rb')这可能对 Google Cloud Storage 有问题。一种解决方案是显式提供encodingtotexts_from_csv作为参数,以便跳过此步骤(默认为无,这意味着自动检测)。

或者,您可以使用其中一种方法将自己的数据作为pandas DataFrame读取。例如,pandas显然支持 GCS,所以你可以简单地这样做:df = pd.read_csv('gs://bucket/your_path.csv')

然后,使用ktrain,您可以使用ktrain.text.texts_from_df(或ktrain.text.texts_from_array)加载和预处理您的数据。

于 2020-06-19T18:21:35.783 回答