问题标签 [google-dl-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 部署后更改 Google Cloud Deep Learning VM 映像版本?
我使用标准 tensorflow-gpu==1.15 映像在 Google Cloud 上部署了深度学习 VM。但是,后来我意识到我需要tensorflow-gpu>=1.4。由于我已经对我的虚拟机实例进行了大量处理,我想知道是否可以升级映像版本而无需部署新的虚拟机?
谢谢!
google-cloud-platform - 使用自定义 docker 映像连接到 Google Cloud AI Platform Notebook 实例会导致“连接被拒绝”
我正在尝试使用自定义图像在 Google Cloud AI Platform 上启动笔记本。我遵循了这里描述的做法:
https://cloud.google.com/ai-platform/deep-learning-containers/docs/derivative-container
所以要构建和推送 docker 镜像:
但是,当尝试使用此图像连接到笔记本实例时
我明白了
即使我只使用基本映像而不做任何更改,也会发生这种情况,例如使用这个 Dockerfile:
如果我直接启动一个笔记本实例,gcr.io/deeplearning-platform-release/base-cpu:latest
我可以按预期连接到它。
编辑 1:从串行端口 1 日志:
似乎是权限错误,但我不确定为什么我无权部署从同一帐户推送的图像。会不会有关系custom-test ntpd[707]: kernel reports TIME_ERROR: 0x41: Clock Unsynchronized
?
编辑 2:现在,大约一个小时后,我可以连接(没有进行任何更改)。但是当访问localhost:8080
我得到:
作为附加控制台中的输出。
从串行端口 1 日志:
编辑 3:将映像作为 VM 启动会导致:
google-cloud-platform - 无法从 Google 深度学习 VM 访问 Jupyter 实验室
我在安装 Google Deep learning VM 后尝试打开 Jupyter Lab。
我在浏览器的 SSH 终端中运行此代码:
我总是遇到同样的错误,无法访问http://localhost:8080/:
你能告诉我我在做什么错吗?谢谢!
ssh - 当SSH在本地机器上终止时保持jupyter实验室笔记本运行?
我希望能够关闭我的本地机器,同时让我的代码在 jupyter lab 中持续运行,然后再继续运行,但是一旦 SSH 终止,jupyter lab 内核就会停止。当我关闭 jupyter 实验室浏览器选项卡时,我的代码也会停止执行。
从谷歌云平台市场我正在使用“深度学习虚拟机”。从那里,我通过建议的 gcloud 命令 (Cloud SDK) SSH 到它gcloud compute ssh --project projectname --zone zonename vmname -- -L 8080:localhost:8080
。然后它会打开与 VM 的 PuTTY 连接,并自动运行 jupyter lab,我现在可以在本地主机上访问它。
在这种情况下,我该怎么做才能在本地机器关闭的情况下运行我的代码?
jupyter-lab - 在谷歌云中构建 jupyterlab
我可以访问运行 jupyterlab 的谷歌云计算实例。我将 jupyterlab 更新到 2.1.4,但是我无法使用扩展进行构建。
当我在控制台中构建时(在 jupyter lab 中构建的一个和实例中的一个),它告诉我构建运行良好,但是当我重新加载 jupyterlab 时告诉我它需要再次构建。
我遇到了一些其他问题,例如使用pip
和尝试使用它时更新包,但版本保持不变。
我该如何解决这个问题?
谢谢
tensorflow - 谷歌深度学习平台无法使用 tensorflow 2.3
我昨天用 Tensorflow 2.3 制作了一个深度学习实例,但在让 GPU 工作时遇到了一些问题,所以我尝试删除并创建一个新的深度学习实例,但现在我无法使用 2.3 版
几天前它可用,但现在不可用。我需要使用这个版本,因为我正在使用的某些功能在 2.2 版本中不可用
google-cloud-platform - 无法使用 GPU 创建 GCP 深度学习 VM 实例
我正在尝试使用 GPU 运行 GCP“深度学习 VM”实例。按照这些说明。我被击中了You've gone over GPUs (all regions) quota by 1 GPU. Please increase your quota in the quotas page. Learn more
。但是,当我查看配额时,我确实对“NVIDIA v100”有 1GPU 限制。我有一个 0 限制Committed NVIDIA ***
。
当您创建“深度学习 VM”实例并选择 GPUS 时,您是否选择了承诺的 GPUS?
google-dl-platform - 无法连接到 jupyterlab:404 客户端错误 (/lab)
我已经在 Google Cloud Platform 上部署了 VM Machine 并增加了配额,他们批准了。但是,当我在终端中使用 SSH 命令(gcloud compute ssh --project ammi-project-283319 --zone us-east1-b pytorch-2-vm -- -L 8080:localhost:8080)连接虚拟机时,然后启动jupyter lab,我遇到以下错误:
404 客户端错误 (/lab)
google-cloud-platform - 升级 GCP 深度学习 VM 时出错
我正在尝试将 VM 从 M58 升级到 M66,以便可以使用 PyTorch 1.8。“编辑VM详细信息”上的升级按钮导致“此操作无法完成”。知道为什么会出现这种情况以及发生这种情况时该怎么办吗?