我已经使用RESTful API向云提交了一个训练作业,并在控制台日志中看到它已成功完成。为了部署模型并将其用于预测,我使用tf.train.Saver().save()
(根据操作指南)保存了最终模型。
在本地运行时,我可以在工作目录中找到图形文件 (export-*
和)。export-*.meta
然而,当在云上运行时,我不知道它们最终会在哪里。API 似乎没有用于指定这一点的参数,它不在训练器应用程序的存储桶中,而且我在作业创建的云存储上找不到任何临时存储桶。
我已经使用RESTful API向云提交了一个训练作业,并在控制台日志中看到它已成功完成。为了部署模型并将其用于预测,我使用tf.train.Saver().save()
(根据操作指南)保存了最终模型。
在本地运行时,我可以在工作目录中找到图形文件 (export-*
和)。export-*.meta
然而,当在云上运行时,我不知道它们最终会在哪里。API 似乎没有用于指定这一点的参数,它不在训练器应用程序的存储桶中,而且我在作业创建的云存储上找不到任何临时存储桶。
当您设置 Cloud ML 环境时,您为此设置了一个存储桶。你进去看过吗?
https://cloud.google.com/ml/docs/how-tos/getting-set-up
编辑(以备将来记录):正如 Robert 在评论中提到的,您需要将输出位置作为参数传递给作业。需要注意的几件事:
每个作业使用唯一的输出位置,因此一个作业不会影响另一个作业的输出。
建议是指定父输出路径,并使用它将导出的模型包含在称为“模型”的子路径中,并在该路径中组织其他输出,如检查点和摘要。这使得管理所有输出变得更加容易。
虽然不是必需的,但我还建议在输出的包子路径中暂存训练代码,这有助于将源与它产生的输出相关联。
最后(!),还请记住,当您使用超参数调整时,您需要将试验 id 附加到输出路径中,以获取单个运行产生的输出。