问题标签 [google-cloud-ml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
82 浏览

google-cloud-datalab - 如何以编程方式授予 Cloud ML 对存储桶的访问权限?

Cloud ML 说明展示了如何使用 gsutil 授予 Cloud ML 对存储桶的访问权限。有没有办法在 python 中以编程方式执行此操作?

0 投票
2 回答
37 浏览

billing - 在 GCML 上一次运行多个作业

前段时间我曾尝试在 Google Cloud ML 上运行多个作业。它失败并出现“允许超过实例数”的错误。但是,当我再次尝试时,我能够一次运行多个培训作业。这个价格是怎么计算的?如果另一个已经在运行,考虑到它对两者使用相同的项目,有没有办法/(需要)排队一个 ML 培训/再培训工作?

0 投票
2 回答
263 浏览

python - 开始使用我自己的数据集启动 google-cloud-ml

我成功执行了 google cloud ml 在线教程的所有步骤。

但是由于本教程中使用的数据集已经是 TFRecord,我不太了解如何将我的 numpy 数据集转换为 TFRecord 数据集。

然后,我尝试使用与官方 convert_to_records.py 相比稍加修改的代码来创建我的 TFRecord 。我的理解是,我们只能将原始变量转换为 TFRecord,这就是使用将浮点列表转换为字节的技巧的原因。然后我必须在某个地方将我的字符串转换回浮点列表。因此,我尝试使用修改后的脚本 model.py 中的第 97 行或第 98 行来执行此任务。

不幸的是,这些尝试都没有奏效。我总是收到以下错误消息:

这是因为我的变量特征的形状是 (batch_size,) 而不是 (batch_size, IMAGE_PIXELS)。但我不明白为什么。

我是在尝试以错误的方式启动 google-cloud-ml 还是有更多参数需要调整?

0 投票
2 回答
152 浏览

google-cloud-platform - GCS / GCML 服务因错误而被阻止(超出管理 CRUD 配额)

昨天我的免费订阅有效期结束了,我注册了 GCML 服务。但是,我无法访问我的 GCS 或 GCML 资源并收到拒绝访问错误。在尝试访问控制台上的作业页面时,我收到以下错误

project_number:836740678279 的配额失败 - 超出“管理 (CRUD) 请求”组中 API 调用的允许 Cloud ML 配额,请参阅https://console.cloud.google.com/apis/api/ml.googleapis .com/quotas了解详情。

但是配额限制是每天 10,000 个,而我当天只用了 105 个(在错误消息中指出的图表上查看)

0 投票
1 回答
950 浏览

google-cloud-ml - Cloud ML Training 作业在“等待 TensorFlow 启动”时停止。

我的训练工作停滞不前,云机器学习日志只显示“等待 TensorFlow 启动”。

0 投票
1 回答
1598 浏览

python - 无论如何,Google App Engine 应用程序是否可以通信或控制机器学习模型或任务?

我想将Google 的机器学习与用 python 编写的App Engine应用程序一起使用。

由于调查性质(使用Kohonen 的 SOM进行数据聚类),此应用程序应在每次使用前重新训练TensorFlow模型。

我有以下问题:

基于App Engine的应用程序可以命令机器学习来使用一些输入数据训练一些模型吗?基于App Engine的应用程序能否将一些输入向量发送到ML 事物并获得结果(该向量属于哪个集群)?如果一切皆有可能,那该怎么做?

如果这一切都不可能,我可以使用任何其他架构来使用基于App Engine的应用程序TensorFlow吗?

我讲这件事: 在此处输入图像描述

0 投票
1 回答
3854 浏览

google-cloud-platform - 向 Google Cloud ML 提交训练作业

我有一个代码如下,我想提交给 Google cloud ml。我已经测试了他们的例子并得到了结果。

这是在 tensorflow 中训练和创建 DNN 模型的代码。我已经在本地进行了测试并收到了结果。我将此代码与init .py 文件一起放在名为 trainer 的文件夹中,并将该文件夹上传到 gs://bucket-ml/second_job/trainer。Second_job 是 JOB_NAME。

然后,当我想将此作为作业提交时,我这样做并收到以下错误:

我不确定包路径和模块名称是否正确。请告诉我该怎么做。感谢和问候,

0 投票
4 回答
177 浏览

tensorflow - MNIST 模型的分布式版本的输出

我在 CloudML 上使用 MNIST 的分布式版本,但我不确定是否理解训练阶段显示的日志:

我一次随机批处理 200 多个示例。

为什么 Train acc/loss 和 Eval acc/loss 之间存在如此大的差距,eval 集的指标明显高于 train 集,而通常情况正好相反?

另外,全局步骤和本地步骤有什么区别?

我正在谈论的代码是here。task.py 正在调用创建图形的文件 model.py。

0 投票
1 回答
672 浏览

tensorflow - 为什么在线预测失败并显示“无法从提要中获取元素作为字节”?

在线预测因“无法从提要中以字节形式获取元素”而失败。这是什么意思,我该如何解决?

我正在使用以下代码生成预测:

0 投票
0 回答
117 浏览

google-cloud-ml - GCML 预测错误 502 Bad Gateway

对 GCML 的“在线”预测服务的初始调用(每隔几个小时)总是会导致服务器错误 502。几分钟后,相同的请求会成功。

为什么会这样?是否每次向模型发出请求时,都会缓存恢复的会话,以便后续调用成功而初始调用失败?此服务如何用于 RRS(请求响应服务)

[更新]

现在在所有预测服务上都出现 502 错误。即使对于以前工作的模型也是如此。已尝试对正常工作的模型进行局部预测