问题标签 [google-ai-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandas - 谷歌ai平台自定义训练:使用pandas read_csv读取谷歌云存储中的csv时出现ValueError
我有一个自定义的 gcp-ai-platform 培训作业脚本,我一直在运行,我上次运行它是在 1 周前。但是,今天相同的训练作业和脚本因错误而失败。
我试图隔离这个问题,当 pandas 试图从谷歌云存储中读取我的训练集 csv 时,我的代码中断了。我的人工智能平台培训工作和谷歌云存储属于同一个项目。
我还注意到在训练作业的初始化过程中日志存在差异,额外的日志行如下:
我不确定这些将如何改变 pandas read_csv 的方式。请帮忙。谢谢。
python - 如何使用 Python 在 Unified AI Platform 上编辑端点设置?
我已经成功地在统一云 AI 平台上创建了一个端点,并在其上部署了两个Model
-Model A
分别Model B
具有 20% 和 80% 的流量。现在,在 Cloud Console(用户界面)上,我可以选择编辑设置 并将流量拆分分别更改为 30% 和 70%,然后Model
部署 s。但是我无法弄清楚如何使用 Python Client API 来做到这一点。
此处提供的文档不足以理解我们如何做到这一点。任何帮助将不胜感激。
optimization - 用于数学优化的 Google AI Platform
我正在考虑在 GCP 上使用 Google AI Platform。但是,我不使用机器学习算法,另一方面,我使用了一些数学优化。所以,我正在使用“Gurobi 优化”来解决我们的优化问题。
我的问题是:
- 就我而言(仅使用数学优化案例),您认为使用 AI Platform 会起作用吗?(我认为使用笔记本、管道和假设分析工具很有吸引力。)
- 我可以从 AI Platform 连接到 Gurobi 优化服务器(在 Compute Engine 上)吗?
python - 从 python 获取使用 ai-platform 部署的模型的指标
当您使用 AI-Platform 部署模型时,您可以在链接中看到
https://console.cloud.google.com/apis/api/ml.googleapis.com/metrics?project=<my_project_name>
部署 ML 模型的 API(或特别是端点)的一些性能指标,例如延迟(响应时间)、发生了多少 200 个状态代码等......
我想从 python 获取这些信息,而不是在 GUI 中。这可能吗 ?我正在阅读此处的文档,但似乎找不到答案。
gcloud - 为什么调用 gcloud AIP(统一)批量预测时出现“发布请求失败。无法获得预测”错误?
为部署在 AIP 统一上的模型调用批量预测会产生一个空结果文件和一个包含以下内容的错误文件:
这很奇怪,因为错误消息包含正确的输出:{"predictions":[{"data":[{"715":{"0":1}}]}]}
,这意味着预测运行成功并且接收端能够读取它,输入是 JSONL 格式并且仅包含一个用于测试目的的实例
任何想法?
google-cloud-platform - 每次调用版本时 AI 平台安装依赖项
我对模型调用的预测有超时问题,这似乎是因为冷启动。似乎模型的节点几乎每次被调用时都在安装依赖项(虽然 minNodes 为 1)。仅当版本超过 1 个时才会出现问题,否则它不会重新安装依赖项并且它会在 1 秒内进行预测,而不是在 120 秒内进行超时...我需要放置更高的 minNodes 吗?
如果有人遇到问题并有解决方案(或任何建议),我真的很感兴趣;)
谢谢
python - 如何使用 Python 删除部署到 Unified AI Platform 上的端点的模型?
我已经成功地在统一云 AI 平台上创建了一个端点,并在其上部署了两个Model
-Model B
分别Model C
具有 20% 和 80% 的流量。我有第三个Model
——Model A
我之前部署的,现在流量为 0%。
现在,在 Cloud Console(用户界面)上,我可以选择取消部署它Model A
,我可以成功地这样做。但是我无法弄清楚如何使用 Python Client API 来做到这一点。
此处提供的文档不足以理解我们如何做到这一点。任何帮助将不胜感激。
google-cloud-platform - GCP AI Platform Unified - AutoScaling
在GCP AI Platform Unified的文档中它说:
即使您已将预测节点配置为使用 GPU,AI Platform 也会根据 CPU 使用情况扩展您的节点;因此,如果您的预测吞吐量导致 GPU 使用率高,但 CPU 使用率不高,您的节点可能无法按预期扩展
我们如何根据 GPU 使用情况进行扩展?