问题标签 [google-dl-platform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
519 浏览

google-dl-platform - 如何创建预装了 tensorflow 或 pytorch 的 GPU VM?

我正在使用谷歌云。有没有一种简单的方法来创建一个带有 GPU 的虚拟机,并且预装了 TensorFlow 或 pytorch?

0 投票
2 回答
376 浏览

google-dl-platform - Jupyter Lab 的 CloudShell 的 Web 预览不起作用

我正在使用说明从 Cloud Shell 启动深度学习图像:

虚拟机启动,我可以通过 ssh 访问它并看到 Jupyter Lab 正在运行。

但是,我无法从 Cloud Shell 进行 WebPreview 以连接到它。我究竟做错了什么?

0 投票
1 回答
56 浏览

google-dl-platform - NIPS 假肢挑战赛的深度学习图像?

如果存在这样的图像,我在哪里可以找到它?

其次,挑战具有 3D 渲染/视频输出组件这一事实是否意味着制作这样的图像会特别困难?

挑战:https ://www.crowdai.org/challenges/nips-2018-ai-for-prosthetics-challenge

0 投票
2 回答
3150 浏览

tensorflow - 如何使用 virtualenv 安装包但仍然使用系统 tensorflow 安装

在我的本地机器上,我进行了设置,以便在进行 ML 测试时将这些依赖项安装在虚拟环境中

我有脚本可以通过、制作 venv、安装需求和执行培训。如果我可以在任何地方使用这些脚本,包括在谷歌深度学习平台虚拟机上,那就太好了,但是当我尝试在 venv 中安装 tensorflow 时,它不再使用 GPU,所以我假设它不再使用系统安装张量流。

我还尝试了这个--system-site-packages标志,它说 tensorflow 已经安装,但后来它停止使用 GPU。

假设我执行以下操作

对于所有依赖项 tensorflow,它表明它存在于系统上,因此它不会安装它们,但它会继续安装 tensorflow。这是为什么?

0 投票
1 回答
3019 浏览

google-cloud-platform - 使用谷歌云计算的深度学习VM时如何更改jupyter实验室的根目录?

我已经按照文档的指示从“深度学习虚拟机映像”成功设置了 GCP 实例。我在以下路径中有一个 ipython 笔记本文件:

/home/myname/my-notebook.ipynb

当我http://localhost:8080/在我的网络浏览器上访问时,jupyter UI 显示正常,但我可以访问的唯一目录是/opt/deeplearning/workspace/tutorials.

我试过使用file > "Open From Path...",但用户界面说找不到该文件。

如何访问我存储的笔记本/home/myname/

0 投票
2 回答
435 浏览

google-cloud-platform - 无法对深度学习图像进行 sudo

我今天安装了最新的 Google Cloud Deep Learning VM Image,VM 启动后,我可以sudo -i通过 SSH web 成功完成。登录后,我开始在后台运行我的 Tensorflow 模型训练(使用 &)。几个小时后,我无法以 root 身份登录。我收到以下消息:

我试过了:

  • sudo -i
  • su sudo -i
  • su root

我能够复制这个问题。有什么建议么?

0 投票
1 回答
560 浏览

tensorflow - 使用英特尔 mkl 的张量流性能下降

使用普通的 tf1.11 运行宽、线性和深度模型推理,该模型预构建了用于 gpu 的深度学习图像版本 M9,相对于版本 M10(用于 cpu 推理)显示出更好的性能

M9:tf-最新-cu92

M10:tf-最新的 CPU

在这两个图像中,tf 版本都是 1.11,并且它们预先构建了英特尔 mkl 优化的二进制文件。我打开 mkl 指令的详细日志记录,在 M10 图像上我看到很多 mkl 相关设置

并用时间记录 mkl 指令。在 M9 图像上我没有观察到任何这样的事情,即使两个图像都显示版本信息为:

当使用 intel mkl 指令而不是 M9 图像时,我看到性能降低了 2-4 倍。注意:即使 M9 图像适用于 gpu,我也关闭了 cuda 设备可见性和仅对 cpu 推理进行基准测试。在干净的 virtualenv 中使用 tf 1.11 的 pip install 在另一个 linux 机器上进行了相同的观察。

关于如何调试或充分利用英特尔 mkl 库的任何见解。

0 投票
1 回答
82 浏览

google-dl-platform - 启动脚本与深度学习机器镜像启动并行运行

我正在使用深度学习图像,同时还提交了一个启动脚本来处理一些自定义,但它似乎是并行运行的,这会导致一些锁定条件。有推荐的解决方法吗?

0 投票
1 回答
321 浏览

google-dl-platform - 如何修复 Google 预构建的深度学习图像中的此错误?

我正在使用 Tensorflow/CUDA 10.0 运行 Google 的预构建深度学习图像。我收到此错误消息:

0 投票
2 回答
1714 浏览

google-cloud-platform - 需要全局 GPU 配额但无法请求增加

我正在尝试使用 GCloud 的深度学习 VM 映像。我对 8 辆 Tesla K80 的请求获得批准。但是,当我尝试使用单个 GPU 创建实例时,我收到一条错误消息,指出已超出全局 GPU 限制 0。

具体的错误语句:错误:(gcloud.compute.instances.create)无法获取资源:-超出配额'GPUS_ALL_REGIONS'。限制:全局 0.0。

我为创建 VM 编写的代码是这样的:

此代码片段来自: https ://cloud.google.com/deep-learning-vm/docs/quickstart-cli

感谢您的时间和精力。