systemd - 停止 systemd 在重启时杀死用户切片

Question

我的解决方案（到目前为止）是从 common-session 中评论 pam_systemd.so。一切都在 system.slice 中运行，没有控制组。我还不确定这会产生什么影响，但至少事情会运行，保持运行并干净地关闭。

我们的软件是内部开发并在 SLES 上运行。它是 java、oracle、sysadmin 的 tomcat 网页等。我们一直在使用一个脚本来启动所有这些进程。在 systemd 之前一直工作得很好。

“env”脚本从配置文件中收集信息，然后调用其他脚本来启动 java、oracle 等。这些其他脚本“su”对用户来说就像“oracle”。

我有一个用于这个“env”脚本的单元并开始工作。如果我运行“systemctl stop env”，则停止工作。

我的问题是，在重新启动时，第一件事是所有用户都被杀死，所有 DB、Java 进程等也被杀死。基本上使 DB 崩溃，因为它们真的没有很好地停止。然后停止尝试运行并且不能因为东西已经关闭。

我尝试添加 KillUserProcesses=no、enable-linger、KillExcludeUsers=、systemd-run --scope，但它们仍然被杀死。

有没有办法让 systemd 在重新启动时不会立即杀死用户，或者我不得不为所有子脚本找出单位？

下面的内容只是为了复制问题——而不是实际运行的脚本。

我能够在 SLES12SP2（systemd 228）上使用以下内容复制它。我建造了一台 Arch 机器，但它并没有杀人。

我注意到不同的一件事是 sleep 600 是 sles12 上的用户切片，但拱上的系统切片。

SLES12 上的 systemd-cgls：

`-user.slice
  |-user-1000.slice
  | |-user@1000.service
  | | `-init.scope
  | |   |-1362 /usr/lib/systemd/systemd --user
  | |   `-1371 (sd-pam)                                                          
  | `-session-c1.scope
  |   `-1383 sleep 600

在拱门上：

└─system.slice
  ├─env.service
  │ └─276 sleep 600

Arch 上的 su 甚至没有创建用户切片和会话。

我的服务文件：

[Unit]
Description=Starts and stops applications needed for an environment
Wants=network.target httpd.service
After=network.target httpd.service sshd.service

[Service]
Type=oneshot
RemainAfterExit=yes
ExecStart=/pro/bin/sys/services/envStart.sh start
ExecStop=/pro/bin/sys/services/envStart.sh stop
ExecReload=/pro/bin/sys/services/envStart.sh restart
TimeoutSec=3600

[Install]
WantedBy=multi-user.target

envStart 脚本：

#!/bin/bash

case $1 in
    start)
        /pro/bin/sys/services/sleep.sh start
    ;;
    stop)
        /pro/bin/sys/services/sleep.sh stop
    ;;
esac

和睡眠脚本：

#!/bin/bash

case $1 in
    start)
        echo "starting sleep"
        su sleepuser -c "sleep 600 &"
    ;;
    stop)
        echo "stopping sleep"
        sleep 300
    ;;
esac

score 1 · Accepted Answer

我有同样/类似的问题。对我来说，用户切换是个问题，导致所有进程都在 user.slice 而不是 system.slice 中启动。显然，user.slice 中不应该运行任何“重要”，而 systemd 只是在关机/重启时杀死所有（？）进程。我通过删除启动脚本中的所有用户开关 (su/sudo) 并使用单元文件 (User=xxx) 中的用户指令解决了这个问题。

score 0 · Accepted Answer

我的解决方案（到目前为止）是从 common-session 中评论 pam_systemd.so。一切都在 system.slice 中运行，没有控制组。我还不确定这会产生什么影响，但至少事情会运行，保持运行并干净地关闭。

score 0 · Accepted Answer

不幸的是，我仍然遇到同样的问题。

我的调查表明，作为使用 User=xxx 指令的替代方法，脚本可以使用“runuser”而不是“sudo”和“su”，因为这是绕过 PAM IIUC 的“su”实现。

对于我管理的大多数服务，这可以解决问题。

我希望有一种方法可以告诉 systemd 以某种方式忽略或延迟杀死用户会话。

systemd - 停止 systemd 在重启时杀死用户切片

3 回答 3

Related

Reference