问题标签 [google-cloud-ai]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
296 浏览

python - 获取“创建版本失败。尝试在 Google Cloud AI 平台上创建自定义模型时在 AI 平台上检测到错误模型

我正在尝试在 AI 平台上部署自定义模型。我已按照 Google 文档中提到的步骤操作:https ://cloud.google.com/ai-platform/prediction/docs/deploying-models#global-endpoint 。

保存的模型存储在 Google Cloud Storage 中,并使用 python 3.7 进行训练。

这些是用于部署的 gcloud 命令

执行这些命令后出现以下错误:

预测器代码如下:

这是设置文件

任何解决方法?

0 投票
1 回答
197 浏览

google-kubernetes-engine - 无法将 Kubeflow 管道部署到 GKE 集群

我根据 Kubeflow Pipelines 的要求(https://cloud.google.com/ai-platform/pipelines/docs/configure-gke-cluster)创建了一个 GKE 集群,如下所示:

  • 3 个节点,至少 4GB 内存和两个 CPU
  • 具有角色的自定义服务帐户:logging.logWriter、monitoring.metricWriter、monitoring.viewer、storage.objectViewer

尝试在 Kubeflow Pipelines(来自 Marketplace)配置上选择集群时,它显示“OAuth 范围不足”。

我想也许我忽略了一个重要步骤,所以我尝试从 Kubeflow Pipelines 配置页面创建一个新集群。尝试选择此集群时,它仍然显示“OAuth 范围不足”。

是否有更多角色需要添加到服务帐户?

0 投票
1 回答
53 浏览

python - 无法遍历谷歌云笔记本实例中文件夹内的文件

我在谷歌云控制台的人工智能平台中使用笔记本实例。我上传了一个文件夹,其中包含大约 30 个 csv 文件。

我运行以下代码来迭代文件,

但是,出于某种原因,我似乎可以遍历文件。单元格以没有错误结束。我该如何解决?

0 投票
0 回答
289 浏览

google-cloud-platform - Google Cloud AI Platform 训练作业:--stream-logs 无限期停止,没有输出

我正在提交一份培训工作

作业提交成功,但终端没有出现日志。“作业 [...] 成功提交”后没有输出。出现,但命令也不会终止。

当我查看在线控制台时,我看到作业正在运行并生成日志(这些日志没有显示在我运行命令的终端中)。即使作业成功完成,命令仍然不会终止。

如果我先gcloud ai-platform jobs submit training不运行--stream-logs然后运行gcloud ai-platform jobs stream-logs新作业,也会发生同样的情况。

你知道这可能发生的任何原因,和/或我可以解决它的任何方法吗?


编辑:我让命令运行了一段时间,在作业已经完成并成功大约 20 分钟后,突然所有日志都出现并且命令终止。所以它在工作,有点,但它似乎需要很长时间才能同步。

0 投票
1 回答
404 浏览

tensorflow - 如何将签名名称设置为 serving_default 以避免部署到 GCP AI 平台后出错

我在 AI Platform 上使用 Tensorflow 训练了一个 DNN 模型。然后我在本地复制模型以仔细检查是否可以从相同的模型中获得预测。

获得一些警告的预测。

(在指定签名名称时可以避免此警告--signature-name predict:)

将模型部署到 AI Platform 后,警告变为错误。服务签名名称必须serving_default如以下错误消息中所示:

{“错误”:“服务签名名称:“服务默认”未在签名定义中找到“}

使用此命令检查保存的模型后:

所以,我保存的模型的签名名称是 then predict

问题是:如何更改签名名称?

PS:下面是我定义 DNN 的方式:

谢谢

0 投票
0 回答
74 浏览

json - 运行在 AI 平台上创建的持续评估作业时解析输入 JSON 字符串时出错

我在google云平台的AI平台上创建了一个持续评估作业,用于基于这个预测真假的模型的分类模型。我自己在 Big Query Table 中填写了真实情况。

原始预测 地面实况
{“预测”:[假]} {“预测”:[假]}

错误日志

部分失败:[{"code":3,"message":"无法将输入 json 字符串解析为 json 值对象:{"predictions": [false]"},{"code":3,"message": "无法将输入的 json 字符串解析为 json 值对象:{"predictions": [false]"},{"message":"为 dataset_id 准备评估时发现标记数据集的数量不正确:xxxxxxxx_xxxx_xxxx_xxxx_xxxxxxxxxxxx"}]

0 投票
1 回答
196 浏览

google-cloud-platform - 如何在统一云 AI 平台上创建用于分布式训练的 config.yaml 文件

我希望使用 Google Cloud 的新服务 - 统一 AI 平台来训练模型。为此,我使用config.yaml如下所示:

但是对于分布式训练,我无法理解如何workerPoolSpec在这个文件中传递多个 s。提供的示例yaml 文件没有考虑我可以提供多个workerPoolSpecs 的情况。

该示例的文档还说“您可以指定多个工作程序池规范以创建具有多个工作程序池的自定义作业”。

在这方面的任何帮助将不胜感激。

0 投票
0 回答
88 浏览

python - 如何将图像数据发送到托管在 Google Cloud AI Platform 中的自定义训练模型?

我有一个非常简单的 CNN 模型,一个多标签图像分类器,我在 Colab 笔记本中进行了预训练。我保存了模型和权重,并将其作为模型上传到 Google Cloud AI Platform(统一)中。

我正在使用 Cloud Functions 从 URL 下载图像并使用 Google 的aiplatformPython 库将其传递给分类器。

分类器的输入层采用[1, 180, 180, 3](具有 3 个通道的 180x180 图像)的形状。

我用来将其发送到我的模型的代码基于Google 的官方示例

我的问题是:instances下面的代码需要是什么样的?我是否需要以某种方式将其解析为 JSON 或其他格式?我只是不明白这个对象应该是什么才能把它放到我的模型中。

此代码使用 Google 的aiplatformPython 库。

发送预测:

我不明白示例中接下来的两行中发生了什么。 我的模型需要了解 image_bytes 吗?我应该向它发送base64吗?

当我点击我的云函数时,它会下载它并将其转换为该形状,但随后我收到此错误消息和堆栈跟踪(图像具有白色背景,因此 [255, 255, 255] 是正确的):

我应该如何格式化对模型的实际调用?

0 投票
0 回答
62 浏览

python - 是否可以使用抢占式 tpu 在 Google 的 AI 平台上训练深度神经网络?

我最近开始使用 Google 的 AI 平台来训练我的深度神经网络模型。由于我们是一个相对较小的研究实验室,我尝试使用抢占式TPU 和主机训练模型。不幸的是,我没有在文档中找到如何做到这一点的方法。

目前,我正在使用以下 shell 脚本提交培训作业:

如果有人能建议我如何更改脚本以仅使用抢占式主机或 TPU,我将非常感激。

在此先感谢 Manuel S.

0 投票
0 回答
59 浏览

google-cloud-platform - 我们是否在 GCP Vertex AI 平台中端点的审核日志中提供了请求/响应日志?

我们训练了 autoML 模型并部署在 GCP 顶点 AI 平台的 Endpoints 上。我们正在寻找对端点发出的所有请求的请求/响应日志。这些日志是否可用,如果是,那么我们如何访问它们?

相关网址:https ://cloud.google.com/vertex-ai/docs/general/audit-logging#enabling_audit_logging