1

由于无法在 Stackdriver 日志记录控制台上访问从 Cloud ML 作业迁移到 V2 日志。最后显示的日志是

Waiting for Tensorflow to start.

作业已成功执行并完成,我只是无法访问日志中的输出

项目的所有 Stackdriver API 均已启用。

在此处输入图像描述

4

2 回答 2

1

这个问题也让我沮丧地在网上搜索了两个星期的答案,直到我遇到了这篇文章。我没有看到 OP 提到的“迁移到 V2”,但我根本无法在 StackDriver 中获取任何应用程序日志,只有作业开始/完成的系统日志。遵循杰里米的回答可以解决问题。

为了使 Jeremy 的回复更易于理解,基本上您添加了 ML 服务帐户

cloud-ml-service@<project-id>.iam.gserviceaccount.com

到您项目的 IAM 成员,至少具有“日志作者”角色。

您可以通过以下方式获取“项目 ID”:

gcloud config list project --format "value(core.project)"

我还分配了 Project->Editor 角色以允许 Bucket 访问。

于 2017-10-13T21:05:20.577 回答
1

Cloud ML 的 Stackdriver 日志记录没有已知问题。您看到“等待 Tensorflow 启动”的事实。表示您正在查看来自 Cloud ML 的日志消息。

如果您的 Python/TensorFlow 程序中的日志丢失,这通常表明 Cloud ML 没有被授权将日志发送到您项目的 Stackdriver 日志记录。要检查权限,请执行以下操作

  1. 按照以下说明识别 Cloud ML 服务帐号
  2. 在 Cloud Console 中选择 IAM 选项卡
  3. 验证 Cloud ML 服务帐号是否已列出并具有Logs Writer权限
于 2016-12-16T13:32:16.030 回答