由于无法在 Stackdriver 日志记录控制台上访问从 Cloud ML 作业迁移到 V2 日志。最后显示的日志是
Waiting for Tensorflow to start.
作业已成功执行并完成,我只是无法访问日志中的输出
项目的所有 Stackdriver API 均已启用。
由于无法在 Stackdriver 日志记录控制台上访问从 Cloud ML 作业迁移到 V2 日志。最后显示的日志是
Waiting for Tensorflow to start.
作业已成功执行并完成,我只是无法访问日志中的输出
项目的所有 Stackdriver API 均已启用。
这个问题也让我沮丧地在网上搜索了两个星期的答案,直到我遇到了这篇文章。我没有看到 OP 提到的“迁移到 V2”,但我根本无法在 StackDriver 中获取任何应用程序日志,只有作业开始/完成的系统日志。遵循杰里米的回答可以解决问题。
为了使 Jeremy 的回复更易于理解,基本上您添加了 ML 服务帐户
cloud-ml-service@<project-id>.iam.gserviceaccount.com
到您项目的 IAM 成员,至少具有“日志作者”角色。
您可以通过以下方式获取“项目 ID”:
gcloud config list project --format "value(core.project)"
我还分配了 Project->Editor 角色以允许 Bucket 访问。
Cloud ML 的 Stackdriver 日志记录没有已知问题。您看到“等待 Tensorflow 启动”的事实。表示您正在查看来自 Cloud ML 的日志消息。
如果您的 Python/TensorFlow 程序中的日志丢失,这通常表明 Cloud ML 没有被授权将日志发送到您项目的 Stackdriver 日志记录。要检查权限,请执行以下操作