4

我正在尝试安装 NVIDIA docker。我使用了这些行:

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)

curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update

接着:

$ sudo apt-get install nvidia-docker

现在尝试通过键入以下内容检查它是否安装正确:

nvidia-docker run --rm nvidia/cuda nvidia-smi

出现此错误:

英伟达码头 | 2018/11/06 13:09:24 错误:尝试在 unix:///var/run/docker.sock 连接到 Docker 守护程序套接字时获得权限被拒绝:获取 http://%2Fvar%2Frun%2Fdocker。 sock/v1.38/version : 拨打 unix /var/run/docker.sock: connect: 权限被拒绝

后来我试过:

sudo nvidia-docker run --rm nvidia/cuda nvidia-smi

出现此错误:

Using default tag: latest latest: Pulling from nvidia/cuda 473ede7ed136: Pull complete c46b5fa4d940: Pull complete 93ae3df89c92: Pull complete 6b1eed27cade: Pull complete d31e9163d0a5: Pull complete 8668af631f88: Pull complete 0d99f8ab6ae2: Pull complete 74440c29d798: Pull complete Digest: sha256:a6b5fd418d1cd0bc6d8a60c1c4ba33670508487039b828904f8494ec29e6b450 Status :为 nvidia/cuda 下载了较新的映像:最新的 docker:来自守护进程的错误响应:OCI 运行时创建失败:container_linux.go:348:启动容器进程导致“exec:\”nvidia-smi\”:在 $PATH 中找不到可执行文件“:未知。

我用 Ubuntu 安装 Linux。有人能帮助我吗?

4

3 回答 3

2

您有两个非常明显的错误。

首先,您的登录用户似乎不允许连接到 docker daemon。这是一个相当标准的问题,你只需要将你的用户登录添加到 docker 组,它应该可以解决这个问题。您需要再次注销/登录才能使此更改生效。

其次,这也是一个相当标准的 linux 问题,您的 shell 有一个名为 PATH 的环境变量,其中包含它将在其中查找命令二进制文件的所有文件夹,当此命令不包含二进制文件的完整路径时。

例如,当你输入 curl 下载 docker-nvidia 时,你的 shell 会在/usr/bin/文件夹中找到它,因为这个文件夹被声明到 PATH 变量中。

这同样适用于您下载的容器和本地系统上的不同用户。您可以调查此特定错误消息并在 github 上找到此问题:https ://github.com/NVIDIA/nvidia-docker/issues/388

于 2018-11-06T13:54:44.500 回答
0

首先为包设置 GPG 和远程仓库

$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list

然后更新 apt 列表

$ sudo apt-get update

现在您安装 nvidia-docker (2) 并重新加载 Docker 守护进程配置

$ sudo apt-get install -y nvidia-docker2

$ sudo pkill -SIGHUP dockerd

Nvidia GPU 首先需要安装驱动程序。这是确保安装它们的方法

$ sudo apt-get remove nvidia -384 ; sudo apt-get install nvidia-384

现在,唯一要做的就是测试您的环境并确保一切都正确安装。只需启动 nvidia-smi(系统管理界面)应用程序即可。

$ docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi

输出将与此类似:

+-------------------------------------------------- --------------------------------------------+

| NVIDIA-SMI 390.77 驱动程序版本:390.77 | |-------------------------------+----------------- -----+-----------+

| GPU名称持久化-M| 总线 ID Disp.A | 挥发性的 Uncorr。纠错 | | Fan Temp Perf Pwr:Usage/Cap| 内存使用 | GPU-Util Compute M. |

|=================================+================= =====+========================|

| 0 特斯拉 K80 关闭 | 00000000:00:1E.0 关闭 | 0 | | 不适用 39C P0 83W / 149W | 0MiB / 11441MiB | 98%

默认 | +-------------------------------+------------------ -----+-----------+

参考:https ://cnvrg.io/how-to-setup-docker-and-nvidia-docker-2-0-on-ubuntu-18-04/

于 2020-09-21T21:01:13.697 回答
0

添加此注释仅供参考。

不推荐使用最新标签,并且预计会出现此错误:

查看已弃用: https ://hub.docker.com/r/nvidia/cuda上的“最新”标签

于 2021-09-11T21:16:43.740 回答