问题标签 [nvidia-docker]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
30 浏览

python - 从 Docker 会话运行 Jupyter 失败

我有一个成功完成并处于正常工作状态的 docker 容器。我可以看到 jupyter, python3 安装成功。除了 Jupyter 提供的用户友好界面之外,docker 正在按预期工作。

我已经尝试在映像构建中运行此代码并收到相同的结果。

其他谷歌搜索只显示了使用 Cloudera/Anaconda 的人。我都没有使用。

我希望能够通过 localhost:8888 访问 jupyter notebook。

0 投票
1 回答
549 浏览

docker - docker容器中的Cuda运行时/驱动程序不兼容

我正在尝试在 Pytorch 附带的 docker 容器中运行这行简单的代码。

我收到此错误:

运行torch.cuda.is_available()返回False

主机具有最新的 Nvidia 驱动程序。Pytorch 与 Cuda 一起提供,因此不应该存在不兼容问题。

什么可能导致这个问题?

编辑: @Patel Sunil 对这个问题的回答回答了我的问题,但我在搜索中没有遇到这个问题,因为他们的问题很广泛,而我的问题是针对 cuda 运行时/驱动程序错误的。对于那些遇到此错误但不知道它是什么症状(即忘记使用 nvidia-docker)的人,我将此作为一个单独的问题发布。

0 投票
1 回答
4749 浏览

docker - Docker 容器中的 nvidia-docker GPU

我正在尝试复制工作/实验,这些工作/实验需要我遵循这个关于设置 Jupyter + Tensorflow + Nvidia GPU + Docker + Google Compute Engine 的特定教程。'

我能够成功安装nvidia-docker. 但是,在教程中的部分下Verify the GPU is Visible from a Docker Container,当我尝试运行时

我收到以下错误(见最后一行):

当我跑步时

我碰巧收到以下executable file not found in $PATH": unknown错误:

我对 docker 很陌生;因此,如果有人可以帮助我完成解决方案,那就太好了。我试过寻找答案,但解决问题的实际过程却让我回避了。任何帮助将不胜感激。

编辑:我按照教程中的说明设置了 GCE 实例(即 Ubuntu 16.04 LTS,50GB 引导磁盘,1 个 GPU,带有 jupyter 和 tensorboard)

0 投票
1 回答
697 浏览

docker - 在 Ubuntu 上的 VS Code 中运行 NGC 容器

我需要在 Ubuntu 的 Docker 上的NVIDA GPU Cloud (NGC) 容器中运行 Python 脚本,并且我想使用Visual Studio Code来编辑、运行和调试它。我已经安装了VS Code Docker Extension并阅读了文档,但似乎都不符合我的目的。

我遵循了NGC 文档,为 Docker (nvidia-docker2) 安装了 NVIDIA Container Runtime,现在我将在命令行上启动 NGC 容器 tarball

如何配置 VS Code 以便可以在此容器中运行和调试 Python 脚本?

0 投票
4 回答
2104 浏览

docker - 没有 nvidia-docker 有没有办法支持 GPU

我正在尝试在没有 nvidia-docker 的情况下在我的容器上获得 gpu 支持

我知道使用 nvidia docker,我只需要使用 --runtime=nvidia 但我目前的情况不允许使用 nvidia-docker

我尝试在我的容器上安装 nvidia 驱动程序、cuda、cudnn,但它失败了。

如何在我的容器上使用没有 nvidia docker 的 tensorflow gpu?

0 投票
0 回答
594 浏览

docker - 尝试在本地环境中访问远程服务器浏览器时出现“未知标志”错误

我正在尝试运行以下 docker 命令。该命令应该产生如下屏幕截图所示的输出,但它会引发错误“Unknown flag - ip”。解决此错误后,我还想将其移植到本地环境中查看浏览器,因为我们没有远程服务器的任何 UI。但是,我在成功完成这项工作时遇到了问题。请注意我的 docker 版本是 18.09.4,构建 d14af54

某些 jupyter notebook 示例存储在以下文件夹中

/opt/nvidia/data/image/examples/brats

我希望能够在我的本地环境中查看这个 jupyter notebook 示例。所以,根据我的理解,我觉得我必须做两个步骤

步骤 1) 执行 docker run 命令,如下代码部分所示

步骤 2) 端口转发到本地环境

但是,执行步骤 1 后出现错误。

步骤 1 的实际输出(错误)

错误 - 输出

步骤 1 的预期输出(成功)

如果第一步成功,下面显示的屏幕截图内容应该是实际输出,它将为我提供端口转发和登录到 jupyter notebook 的详细信息

在此处输入图像描述

一次,我能够成功执行第 1 步,我应该能够转发

第 1 步 - 代码

第 2 步 - 代码

由于我们的 docker 在远程 gpu 中运行,我们没有 UI 来查看它。为了在我的桌面(http://localhost:8234)中本地访问它,我进行端口转发。

目前,两者都无法使用 127.0.0.1:8888 或 127.0.0.1:8234 访问 Jupyter notebook。在这两种情况下,它都失败了

我希望能够解决第 1 步的问题并能够执行第 2 步(端口转发)并在我的本地浏览器中查看 Jupyter 笔记本。你能帮忙吗?

0 投票
0 回答
1012 浏览

docker - 从 docker 容器端口转发到我的本地桌面(容器 --> 远程主机 --> 本地桌面)

我有一个在 docker 容器中运行的 jupyter 笔记本。我想将它移植到我的本地桌面浏览器。为此,我执行以下步骤

1)将容器端口发布到远程主机端口 2)端口转发远程主机端口到本地主机(桌面)

虽然我尝试这样做,但我收到一条错误消息“无法显示页面”。如果我对 docker 命令有任何错误,请告诉我

发布端口(容器到远程主机)

ubuntu bash 屏幕中的端口转发

上述两个命令的执行对我在本地桌面打开浏览器没有帮助

但是,当我使用--network-host时,它可以工作

你能告诉我我的 docker 命令有什么错误,或者它没有打开的原因是什么?

我希望能够在没有--network=host选项的情况下在我的桌面上本地打开 jupyter 笔记本,并且您可以帮助我修复我的 docker 命令/端口相关问题

0 投票
1 回答
854 浏览

tensorflow - python 3.6 或 3.7 是否提供 nvidia tensorflow docker 映像?

https://ngc.nvidia.com/catalog/containers/nvidia:tensorflow上的图像使用 python 3.5。是否有可用的 python 3.6 或 3.7 图像,所以我不必将所有 f 字符串更改为 Python 3.5 格式?

0 投票
1 回答
881 浏览

docker - 无法使用 docker 命令启动服务器 - 挂载目录 -OCI 运行时错误

我想根据以下 docker 命令启动 orthanc 服务器。但是,当我执行命令时,我收到如下所示的错误。

请注意,orthanc.json 和 orthanc-db 都存在于各自的文件夹中

/orthanc/orthanc.json - orthanc.json 存在于 orthanc 文件夹下

/orthanc/orthanc-db - orthanc-db 存在于 orthanc 文件夹下

/etc/orthanc/orthanc.json - orthanc.json 存在于 /etc/orthanc 文件夹下

/var/lib/orthanc/orthanc-db - orthanc-db 存在于 /var/lib/orthanc 文件夹下

上面列出的所有路径都是有效的。我可以导航到他们

Docker 命令启动 orthanc 服务器

执行命令后的错误信息

你能帮我解决这个问题吗?我正在尝试通过此 docker 命令启动 orthanc 服务器。不知道为什么当文件存在时它会抛出错误。

0 投票
1 回答
2425 浏览

python-3.x - ModuleNotFoundError:没有名为“tensorrt”的模块

重建步骤:

回溯(最后一次调用): ModuleNotFoundError 中的
文件“”,第 1 行
:没有名为“tensorrt”的模块

其他可能有用的信息:

nvcc:NVIDIA (R) Cuda 编译器驱动程序
版权所有 (c) 2005-2019 NVIDIA Corporation
基于 Thu_Apr_18_19:10:59_PDT_2019
Cuda 编译工具,版本 10.1,V10.1.163

2019 年 6 月 9 日星期日 06:05:01
+---------------------------------------- -------------------------------------+
| NVIDIA-SMI 418.67 驱动程序版本:418.67 CUDA 版本:10.1 | |-------------------------------+----------------- -----+-----------+
| GPU名称持久化-M| 总线 ID Disp.A | 挥发性的 Uncorr。纠错 |
| Fan Temp Perf Pwr:Usage/Cap| 内存使用 | GPU-Util Compute M. |
|=================================+================= =====+========================|
| 0 GeForce RTX 208... 开 | 00000000:01:00.0 关闭 | 不适用 |
| 0% 37C P0 65W / 260W | 105MiB / 10989MiB | 2% 默认 |
+-------------------------------+------------------ -----+-----------+
| 1 GeForce RTX 208... 开 | 00000000:02:00.0 关闭 | 不适用 |
| 0% 35C P8 19W / 260W | 1MiB / 10989MiB | 0% 默认 |
+-------------------------------+------------------ -----+-----------+

+-------------------------------------------------- ----------------------------+
| 进程:GPU 内存 |
| GPU PID 类型 进程名称 用法 |
|=================================================== =============================|
+-------------------------------------------------- --------------------------------------------+

我可以确认 TensorRT 样本(仅检查 sampleMNIST)工作。我通过 nv-tensorrt-repo-ubuntu1804-cuda10.1-trt5.1.5.0-ga-20190427_1-1_amd64.deb 安装了样本。

还:

ii libnvinfer-dev 5.1.5-1+cuda10.1 amd64 TensorRT 开发库和头文件

ii libnvinfer-samples 5.1.5-1+cuda10.1 所有 TensorRT 示例和文档

ii libnvinfer5 5.1.5-1+cuda10.1 amd64 TensorRT 运行时库