我正在尝试使用 linux 命名空间。特别是 pid 命名空间。
我以为我会用 bash 测试一些东西,但遇到了这个问题:
unshare -p /bin/bash
bash: fork: Cannot allocate memory
从那里运行 ls 给出了核心转储。退出是唯一可能的事情。
为什么这样做?
我正在尝试使用 linux 命名空间。特别是 pid 命名空间。
我以为我会用 bash 测试一些东西,但遇到了这个问题:
unshare -p /bin/bash
bash: fork: Cannot allocate memory
从那里运行 ls 给出了核心转储。退出是唯一可能的事情。
为什么这样做?
该错误是由新命名空间中的 PID 1 进程退出引起的。
bash 开始运行后,bash 会 fork 几个新的子进程来做一些事情。如果你在没有 -f 的情况下运行 unshare,bash 将具有与当前“unshare”进程相同的 pid。当前的“unshare”进程调用unshare系统调用,创建一个新的pid命名空间,但是当前的“unshare”进程不在新的pid命名空间中。这是linux内核所期望的行为:进程A创建一个新的命名空间,进程A本身不会被放入新的命名空间,只有进程A的子进程会被放入新的命名空间。所以当你运行时:
取消共享 -p /bin/bash
unshare进程会执行/bin/bash,/bin/bash会fork几个子进程,bash的第一个子进程会成为新命名空间的PID 1,子进程完成任务后退出。所以新命名空间的 PID 1 退出。
PID 1 进程有一个特殊的功能:它应该成为所有孤儿进程的父进程。如果根命名空间中的 PID 1 进程退出,内核将崩溃。如果子命名空间中的 PID 1 进程退出,Linux 内核将调用 disable_pid_allocation 函数,该函数将清除该命名空间中的 PIDN_HASH_ADDING 标志。当 linux 内核创建一个新进程时,内核会调用 alloc_pid 函数在命名空间中分配一个 PID,如果没有设置 PIDNS_HASH_ADDING 标志,alloc_pid 函数将返回一个 -ENOMEM 错误。这就是您收到“无法分配内存”错误的原因。
您可以使用“-f”选项解决此问题:
取消共享 -fp /bin/bash
如果您使用“-f”选项运行 unshare,unshare 将在创建新的 pid 命名空间后派生一个新进程。并在新进程中运行 /bin/bash。新进程将是新 pid 命名空间的 pid 1。然后 bash 也会 fork 几个子进程来做一些工作。由于 bash 本身是新 pid 命名空间的 pid 1,它的子进程可以毫无问题地退出。
这并没有解释为什么会发生这种情况,但显示了如何在新的 pid 命名空间中正确启动 shell:
使用该-f
标志从以下位置分叉外壳unshare
:
unshare -fp /bin/bash
您还需要传递--mount-proc
选项以确保 shell 将在新创建的命名空间中获得 PID 1:
unshare -fp --mount-proc /bin/bash
现在运行ps
:
# ps
PID TTY TIME CMD
1 pts/1 00:00:00 bash
11 pts/1 00:00:00 ps