25

在处理 Udacity 深度学习作业时,我遇到了记忆问题。我需要切换到云平台。我之前使用过 AWS EC2,但现在我想尝试 Google Cloud Platform (GCP)。我至少需要 8GB 内存。我知道如何在本地使用 docker,但从未在云端尝试过。

  1. 有没有现成的解决方案可以在 GCP 上运行 Tensorflow?
  2. 如果不是,哪种服务(Compute Engine 或 Container Engine)更容易上手?
  3. 任何其他提示也表示赞赏!
4

6 回答 6

22

总结答案:

在 Compute Engine 上手动运行 TensorFlow 的说明:

  1. 创建项目
  2. 打开Cloud Shell(顶部的按钮)
  3. 列出机器类型:gcloud compute machine-types list。您可以更改我在下一个命令中使用的机器类型。
  4. 创建一个实例:
gcloud compute instances create tf \
  --image container-vm \
  --zone europe-west1-c \
  --machine-type n1-standard-2
  1. 运行sudo docker run -d -p 8888:8888 --name tf b.gcr.io/tensorflow-udacity/assignments:0.5.0(将图像名称更改为所需的名称)
  2. 在仪表板中找到您的实例并编辑default网络。
  3. 添加防火墙规则以允许您的 IP 以及协议和端口tcp:8888
  4. 从仪表板中找到实例的外部 IP。IP:8888在浏览器上打开。完毕!
  5. 完成后,删除创建的集群以避免收费。

我就是这样做的,而且效果很好。我相信有一种更简单的方法可以做到这一点。

更多资源

您可能有兴趣了解更多关于:

很高兴知道

  • “您的 Cloud Shell 主目录的内容在所有 Cloud Shell 会话之间的项目中持续存在,即使在虚拟机终止并重新启动之后也是如此”
  • 要列出所有可用的映像版本:gcloud compute images list --project google-containers

感谢@user728291、@MattW、@CJCullen 和@zain-rizvi

于 2016-04-29T00:36:46.867 回答
10

谷歌云机器学习今天以 Beta 形式向全世界开放。它提供 TensorFlow 即服务,因此您不必管理机器和其他原始资源。作为 Beta 版的一部分,Datalab 已更新为提供用于机器学习的命令和实用程序。查看:http ://cloud.google.com/ml 。

于 2016-09-29T17:24:10.200 回答
3

谷歌有一个处于有限 Alpha 阶段的Cloud ML 平台

这是一篇关于在 Kubernetes/Google Container Engine 上运行 TensorFlow的文和教程。

如果这些不是您想要的,TensorFlow 教程应该都可以在 AWS EC2 或 Google Compute Engine 上运行。

于 2016-04-28T20:30:40.853 回答
2

您现在还可以使用预先配置的 DeepLearning图像。他们拥有 TensorFlow 所需的一切。

于 2018-08-09T21:30:06.727 回答
1

这是一个老问题,但现在有新的、更简单的选择:

如果你想用 Jupyter Lab 运行 TensorFlow

GCP AI Platform Notebooks,让您可以点击访问预装了 Tensorflow 的 Jupyter Lab Notebook(如果您愿意,也可以使用 Pytorch、R 或其他一些库)。

如果您只想使用原始 VM

如果您不关心 Jupyer Lab,而只想要一个预装了 Tensorflow 的原始 VM,则可以改为使用 GCP 的深度学习 VM 映像创建一个 VM 。这些 DLVM 映像为您提供了一个预安装了 Tensorflow 的 VM,并且如果您愿意,它们都可以使用 GPU。(AI Platform Notebooks 在后台使用这些 DLVM 图像)

如果您想在笔记本电脑和云上运行它

最后,如果您希望能够在您的个人笔记本电脑和云中运行 tensorflow,并且可以轻松使用 Docker,您可以使用 GCP 的深度学习容器映像。它包含与 DLVM 映像完全相同的设置,但被打包为容器,因此您可以在任何您喜欢的地方启动它们。

额外好处:如果您在笔记本电脑上运行此容器映像,它是 100% 免费的:D

于 2019-08-02T22:52:29.047 回答
0

我不确定你是否需要留在谷歌云平台上。如果您能够使用其他产品,您可能会节省大量时间和金钱。

如果您使用的是 TensorFLow,我会推荐一个名为TensorPort的平台。它专门用于 TesnorFlow,是我所知道的简单平台。代码和数据是用 git 加载的,它们提供了一个 python 模块,用于在远程机器和本地机器之间自动切换路径。如果您需要,它们还提供了一些用于设置分布式计算的样板代码。希望这可以帮助。

于 2017-08-02T18:18:16.223 回答