6

我的解决方案(到目前为止)是从 common-session 中评论 pam_systemd.so。一切都在 system.slice 中运行,没有控制组。我还不确定这会产生什么影响,但至少事情会运行,保持运行并干净地关闭。

我们的软件是内部开发并在 SLES 上运行。它是 java、oracle、sysadmin 的 tomcat 网页等。我们一直在使用一个脚本来启动所有这些进程。在 systemd 之前一直工作得很好。

“env”脚本从配置文件中收集信息,然后调用其他脚本来启动 java、oracle 等。这些其他脚本“su”对用户来说就像“oracle”。

我有一个用于这个“env”脚本的单元并开始工作。如果我运行“systemctl stop env”,则停止工作。

我的问题是,在重新启动时,第一件事是所有用户都被杀死,所有 DB、Java 进程等也被杀死。基本上使 DB 崩溃,因为它们真的没有很好地停止。然后停止尝试运行并且不能因为东西已经关闭。

我尝试添加 KillUserProcesses=no、enable-linger、KillExcludeUsers=、systemd-run --scope,但它们仍然被杀死。

有没有办法让 systemd 在重新启动时不会立即杀死用户,或者我不得不为所有子脚本找出单位?

下面的内容只是为了复制问题——而不是实际运行的脚本。

我能够在 SLES12SP2(systemd 228)上使用以下内容复制它。我建造了一台 Arch 机器,但它并没有杀人。

我注意到不同的一件事是 sleep 600 是 sles12 上的用户切片,但拱上的系统切片。

SLES12 上的 systemd-cgls:

`-user.slice
  |-user-1000.slice
  | |-user@1000.service
  | | `-init.scope
  | |   |-1362 /usr/lib/systemd/systemd --user
  | |   `-1371 (sd-pam)                                                          
  | `-session-c1.scope
  |   `-1383 sleep 600

在拱门上:

└─system.slice
  ├─env.service
  │ └─276 sleep 600

Arch 上的 su 甚至没有创建用户切片和会话。

我的服务文件:

[Unit]
Description=Starts and stops applications needed for an environment
Wants=network.target httpd.service
After=network.target httpd.service sshd.service

[Service]
Type=oneshot
RemainAfterExit=yes
ExecStart=/pro/bin/sys/services/envStart.sh start
ExecStop=/pro/bin/sys/services/envStart.sh stop
ExecReload=/pro/bin/sys/services/envStart.sh restart
TimeoutSec=3600

[Install]
WantedBy=multi-user.target

envStart 脚本:

#!/bin/bash

case $1 in
    start)
        /pro/bin/sys/services/sleep.sh start
    ;;
    stop)
        /pro/bin/sys/services/sleep.sh stop
    ;;
esac

和睡眠脚本:

#!/bin/bash

case $1 in
    start)
        echo "starting sleep"
        su sleepuser -c "sleep 600 &"
    ;;
    stop)
        echo "stopping sleep"
        sleep 300
    ;;
esac
4

3 回答 3

1

我有同样/类似的问题。对我来说,用户切换是个问题,导致所有进程都在 user.slice 而不是 system.slice 中启动。显然,user.slice 中不应该运行任何“重要”,而 systemd 只是在关机/重启时杀死所有(?)进程。我通过删除启动脚本中的所有用户开关 (su/sudo) 并使用单元文件 (User=xxx) 中的用户指令解决了这个问题。

于 2019-09-25T08:28:04.487 回答
0

我的解决方案(到目前为止)是从 common-session 中评论 pam_systemd.so。一切都在 system.slice 中运行,没有控制组。我还不确定这会产生什么影响,但至少事情会运行,保持运行并干净地关闭。

于 2017-03-24T13:57:45.077 回答
0

不幸的是,我仍然遇到同样的问题。

我的调查表明,作为使用 User=xxx 指令的替代方法,脚本可以使用“runuser”而不是“sudo”和“su”,因为这是绕过 PAM IIUC 的“su”实现。

对于我管理的大多数服务,这可以解决问题。

我希望有一种方法可以告诉 systemd 以某种方式忽略或延迟杀死用户会话。

于 2020-01-31T21:15:08.810 回答