问题标签 [google-cloud-ml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-datalab - 如何以编程方式授予 Cloud ML 对存储桶的访问权限?
Cloud ML 说明展示了如何使用 gsutil 授予 Cloud ML 对存储桶的访问权限。有没有办法在 python 中以编程方式执行此操作?
billing - 在 GCML 上一次运行多个作业
前段时间我曾尝试在 Google Cloud ML 上运行多个作业。它失败并出现“允许超过实例数”的错误。但是,当我再次尝试时,我能够一次运行多个培训作业。这个价格是怎么计算的?如果另一个已经在运行,考虑到它对两者使用相同的项目,有没有办法/(需要)排队一个 ML 培训/再培训工作?
python - 开始使用我自己的数据集启动 google-cloud-ml
我成功执行了 google cloud ml 在线教程的所有步骤。
但是由于本教程中使用的数据集已经是 TFRecord,我不太了解如何将我的 numpy 数据集转换为 TFRecord 数据集。
然后,我尝试使用与官方 convert_to_records.py 相比稍加修改的代码来创建我的 TFRecord 。我的理解是,我们只能将原始变量转换为 TFRecord,这就是使用将浮点列表转换为字节的技巧的原因。然后我必须在某个地方将我的字符串转换回浮点列表。因此,我尝试使用修改后的脚本 model.py 中的第 97 行或第 98 行来执行此任务。
不幸的是,这些尝试都没有奏效。我总是收到以下错误消息:
这是因为我的变量特征的形状是 (batch_size,) 而不是 (batch_size, IMAGE_PIXELS)。但我不明白为什么。
我是在尝试以错误的方式启动 google-cloud-ml 还是有更多参数需要调整?
google-cloud-platform - GCS / GCML 服务因错误而被阻止(超出管理 CRUD 配额)
昨天我的免费订阅有效期结束了,我注册了 GCML 服务。但是,我无法访问我的 GCS 或 GCML 资源并收到拒绝访问错误。在尝试访问控制台上的作业页面时,我收到以下错误
project_number:836740678279 的配额失败 - 超出“管理 (CRUD) 请求”组中 API 调用的允许 Cloud ML 配额,请参阅https://console.cloud.google.com/apis/api/ml.googleapis .com/quotas了解详情。
但是配额限制是每天 10,000 个,而我当天只用了 105 个(在错误消息中指出的图表上查看)
google-cloud-ml - Cloud ML Training 作业在“等待 TensorFlow 启动”时停止。
我的训练工作停滞不前,云机器学习日志只显示“等待 TensorFlow 启动”。
google-cloud-platform - 向 Google Cloud ML 提交训练作业
我有一个代码如下,我想提交给 Google cloud ml。我已经测试了他们的例子并得到了结果。
这是在 tensorflow 中训练和创建 DNN 模型的代码。我已经在本地进行了测试并收到了结果。我将此代码与init .py 文件一起放在名为 trainer 的文件夹中,并将该文件夹上传到 gs://bucket-ml/second_job/trainer。Second_job 是 JOB_NAME。
然后,当我想将此作为作业提交时,我这样做并收到以下错误:
我不确定包路径和模块名称是否正确。请告诉我该怎么做。感谢和问候,
tensorflow - MNIST 模型的分布式版本的输出
我在 CloudML 上使用 MNIST 的分布式版本,但我不确定是否理解训练阶段显示的日志:
我一次随机批处理 200 多个示例。
为什么 Train acc/loss 和 Eval acc/loss 之间存在如此大的差距,eval 集的指标明显高于 train 集,而通常情况正好相反?
另外,全局步骤和本地步骤有什么区别?
我正在谈论的代码是here。task.py 正在调用创建图形的文件 model.py。
tensorflow - 为什么在线预测失败并显示“无法从提要中获取元素作为字节”?
在线预测因“无法从提要中以字节形式获取元素”而失败。这是什么意思,我该如何解决?
我正在使用以下代码生成预测:
google-cloud-ml - GCML 预测错误 502 Bad Gateway
对 GCML 的“在线”预测服务的初始调用(每隔几个小时)总是会导致服务器错误 502。几分钟后,相同的请求会成功。
为什么会这样?是否每次向模型发出请求时,都会缓存恢复的会话,以便后续调用成功而初始调用失败?此服务如何用于 RRS(请求响应服务)
[更新]
现在在所有预测服务上都出现 502 错误。即使对于以前工作的模型也是如此。已尝试对正常工作的模型进行局部预测