380

我正在尝试为我们的开发过程构建一个新的 Docker 映像,cpanm用于安装一堆 Perl 模块作为各种项目的基础映像。

在开发 Dockerfile 时,cpanm由于某些模块未正确安装,因此返回失败代码。

我很确定我需要apt安装更多的东西。

我的问题是,我在哪里可以找到/.cpanm/work输出中引用的目录,以便检查日志?在一般情况下,如何检查失败docker build命令的文件系统?

早上编辑咬紧牙关运行后find我发现

/var/lib/docker/aufs/diff/3afa404e[...]/.cpanm

这是可靠的,还是我最好构建一个“裸”容器并手动运行东西,直到我拥有我需要的所有东西?

4

8 回答 8

481

每次 docker 成功执行RUN来自 Dockerfile 的命令时,都会提交映像文件系统中的新层。您可以方便地使用这些图层 ID 作为图像来启动新容器。

获取以下 Dockerfile:

FROM busybox
RUN echo 'foo' > /tmp/foo.txt
RUN echo 'bar' >> /tmp/foo.txt

并构建它:

$ docker build -t so-26220957 .
Sending build context to Docker daemon 47.62 kB
Step 1/3 : FROM busybox
 ---> 00f017a8c2a6
Step 2/3 : RUN echo 'foo' > /tmp/foo.txt
 ---> Running in 4dbd01ebf27f
 ---> 044e1532c690
Removing intermediate container 4dbd01ebf27f
Step 3/3 : RUN echo 'bar' >> /tmp/foo.txt
 ---> Running in 74d81cb9d2b1
 ---> 5bd8172529c1
Removing intermediate container 74d81cb9d2b1
Successfully built 5bd8172529c1

您现在可以从和00f017a8c2a6启动一个新容器:044e1532c6905bd8172529c1

$ docker run --rm 00f017a8c2a6 cat /tmp/foo.txt
cat: /tmp/foo.txt: No such file or directory

$ docker run --rm 044e1532c690 cat /tmp/foo.txt
foo

$ docker run --rm 5bd8172529c1 cat /tmp/foo.txt
foo
bar

当然,您可能想启动一个 shell 来探索文件系统并尝试命令:

$ docker run --rm -it 044e1532c690 sh      
/ # ls -l /tmp
total 4
-rw-r--r--    1 root     root             4 Mar  9 19:09 foo.txt
/ # cat /tmp/foo.txt 
foo

当其中一个 Dockerfile 命令失败时,您需要做的是查找前一层的 id并在从该 id 创建的容器中运行 shell:

docker run --rm -it <id_last_working_layer> bash -il

一旦进入容器:

  • 尝试失败的命令,并重现问题
  • 然后修复命令并测试它
  • 最后用固定的命令更新你的 Dockerfile

如果您确实需要在失败的实际层中进行试验,而不是从最后一个工作层开始工作,请参阅Drew 的回答

于 2014-10-06T18:38:36.287 回答
252

如果您想检查失败命令之前的状态,最佳答案是有效的。

但是,问题询问如何检查失败容器本身的状态。在我的情况下,失败的命令是一个需要几个小时的构建,因此在失败的命令之前倒带并再次运行它需要很长时间并且不是很有帮助。

这里的解决方案是找到失败的容器:

$ docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS                          PORTS               NAMES
6934ada98de6        42e0228751b3        "/bin/sh -c './utils/"   24 minutes ago      Exited (1) About a minute ago                       sleepy_bell

将其提交到图像:

$ docker commit 6934ada98de6
sha256:7015687976a478e0e94b60fa496d319cdf4ec847bcd612aecf869a72336e6b83

然后运行映像 [如果需要,运行 bash]:

$ docker run -it 7015687976a4 [bash -il]

现在,您实际上是在查看构建失败时的状态,而不是在运行导致失败的命令之前的状态。

于 2016-02-14T01:35:33.080 回答
78

更新 docker 版本 20.10 及以后的版本

Linux 或 macOS

DOCKER_BUILDKIT=0 docker build ...

视窗

# Command line
set DOCKER_BUILDKIT=0 docker build ...
# PowerShell
$env:DOCKER_BUILDKIT=0

用于 DOCKER_BUILDKIT=0 docker build ... 获取旧版本中已知的中间容器哈希。

在较新的版本中,默认情况下会激活 Buildkit。建议仅将其用于调试目的。Build Kit 可以让您的构建速度更快。

供参考:Buildkit 不支持中间容器哈希:https ://github.com/moby/buildkit/issues/1053

感谢@David Callanan 和@MegaCookie 的投入。

于 2021-03-23T20:25:41.503 回答
21

Docker在每个成功的行之后缓存整个文件系统状态。RUN

知道:

  • 要检查失败命令之前的最新状态,请RUN在 Dockerfile 中将其注释掉(以及任何和所有后续RUN命令),然后docker build再次运行docker run
  • 要检查失败命令RUN的状态,只需添加|| true它以强制它成功;然后像上面一样继续(保留任何和所有后续RUN命令注释掉,运行docker builddocker run

Tada,不需要弄乱 Docker 内部结构或层 ID,作为奖励,Docker 会自动最小化需要重新完成的工作量。

于 2015-02-07T10:19:59.283 回答
4

调试构建步骤失败确实很烦人。

我发现的最佳解决方案是确保执行实际工作的每个步骤都成功,并在失败的步骤之后添加检查。这样,您将获得一个已提交的层,其中包含您可以检查的失败步骤的输出。

一个 Dockerfile,行后有一个示例# Run DB2 silent installer

#
# DB2 10.5 Client Dockerfile (Part 1)
#
# Requires
#   - DB2 10.5 Client for 64bit Linux ibm_data_server_runtime_client_linuxx64_v10.5.tar.gz
#   - Response file for DB2 10.5 Client for 64bit Linux db2rtcl_nr.rsp 
#
#
# Using Ubuntu 14.04 base image as the starting point.
FROM ubuntu:14.04

MAINTAINER David Carew <carew@us.ibm.com>

# DB2 prereqs (also installing sharutils package as we use the utility uuencode to generate password - all others are required for the DB2 Client) 
RUN dpkg --add-architecture i386 && apt-get update && apt-get install -y sharutils binutils libstdc++6:i386 libpam0g:i386 && ln -s /lib/i386-linux-gnu/libpam.so.0 /lib/libpam.so.0
RUN apt-get install -y libxml2


# Create user db2clnt
# Generate strong random password and allow sudo to root w/o password
#
RUN  \
   adduser --quiet --disabled-password -shell /bin/bash -home /home/db2clnt --gecos "DB2 Client" db2clnt && \
   echo db2clnt:`dd if=/dev/urandom bs=16 count=1 2>/dev/null | uuencode -| head -n 2 | grep -v begin | cut -b 2-10` | chgpasswd && \
   adduser db2clnt sudo && \
   echo '%sudo ALL=(ALL) NOPASSWD:ALL' >> /etc/sudoers

# Install DB2
RUN mkdir /install
# Copy DB2 tarball - ADD command will expand it automatically
ADD v10.5fp9_linuxx64_rtcl.tar.gz /install/
# Copy response file
COPY  db2rtcl_nr.rsp /install/
# Run  DB2 silent installer
RUN mkdir /logs
RUN (/install/rtcl/db2setup -t /logs/trace -l /logs/log -u /install/db2rtcl_nr.rsp && touch /install/done) || /bin/true
RUN test -f /install/done || (echo ERROR-------; echo install failed, see files in container /logs directory of the last container layer; echo run docker run '<last image id>' /bin/cat /logs/trace; echo ----------)
RUN test -f /install/done

# Clean up unwanted files
RUN rm -fr /install/rtcl

# Login as db2clnt user
CMD su - db2clnt
于 2017-11-26T11:09:35.370 回答
2

目前使用最新的 docker-desktop,没有办法退出新的 Buildkit,它还不支持调试(请关注此 GitHub 线程上的最新更新:https ://github.com/moby /buildkit/issues/1472)。

  • 首先让 docker 尝试构建,并找出 Dockerfile 中的哪一行失败。
  • 接下来,在您的 Dockerfile 中,您可以在顶部添加构建目标:FROM xxx as debug
  • 然后,在您的 Dockerfile 中,在失败的命令前一行添加一个附加目标FROM xxx as next(因为您不想构建该部分)。例子:
FROM xxx as debug
# Working command
RUN echo "working command"

FROM xxx as next
# Example of failing command
RUN echoo "failing command"

  • 然后运行docker build -f Dockerfile --target debug --tag debug .
  • 接下来你可以运行docker run -it debug /bin/sh

您可以通过按 CTRL P + CTRL Q 退出 shell

如果您想使用docker compose builddocker build,可以通过target: debugdocker-compose.yml 下build添加。
然后通过以下方式启动容器docker compose run xxxYourServiceNamexxx并使用:

  • 了解如何在容器内运行 shell的第二个最佳答案。
  • 或者在 Dockerfile 中ENTRYPOINT /bin/sh的行之前添加。FROM xxx as next
于 2021-09-01T13:27:15.750 回答
2

就我而言,我必须:

DOCKER_BUILDKIT=1 docker build ...

正如 Jannis Schönleber 在他的回答中提到的那样,目前在这种情况下没有可用的调试(即没有创建中间图像/容器)。

我发现我可以做的是使用以下选项:

... --progress=plain ...

然后RUN ...在现有的上添加各种或附加的行RUN ...来调试特定的命令。这让你觉得我可以完全访问(至少如果你的构建速度相对较快)。

例如,您可以像这样检查一个变量:

RUN echo "Variable NAME = [$NAME]"

如果您想知道文件是否安装正确,请执行以下操作:

RUN find /

等等

在我的情况下,我不得不调试带有私有存储库的 Go 应用程序的 docker 构建,并且很难进行调试。我在这里有其他详细信息。

于 2021-10-29T22:57:50.407 回答
0

我要做的是注释掉下面的 Dockerfile 并包括有问题的行。然后就可以运行容器,手动运行docker命令,照常查看日志。例如,如果 Dockerfile 是

RUN foo
RUN bar
RUN baz

我会在酒吧里死去

RUN foo
# RUN bar
# RUN baz

然后

$ docker build -t foo .
$ docker run -it foo bash
container# bar
...grep logs...
于 2014-10-06T17:33:24.630 回答