我对某个服务器上的一些类似僵尸的进程有疑问,这些进程需要不时被杀死。我怎样才能最好地识别运行时间超过一个小时左右的那些?
14 回答
找到了一个适合我的答案:
警告:这将找到并杀死长时间运行的进程
ps -eo uid,pid,etime | egrep '^ *user-id' | egrep ' ([0-9]+-)?([0-9]{2}:?){3}' | awk '{print $2}' | xargs -I{} kill {}
(其中user-id是具有长时间运行进程的特定用户 ID。)
第二个正则表达式匹配具有可选天数的时间,后跟小时、分钟和秒组件,因此长度至少为一小时。
如果他们只是需要被杀死:
if [[ "$(uname)" = "Linux" ]];then killall --older-than 1h someprocessname;fi
如果你想看看它匹配的是什么
if [[ "$(uname)" = "Linux" ]];then killall -i --older-than 1h someprocessname;fi
对于每个进程匹配,该-i
标志将提示您是/否。
对于超过一天的任何事情,
ps aux
会给你答案,但它会下降到日精度,这可能没有那么有用。
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 7200 308 ? Ss Jun22 0:02 init [5]
root 2 0.0 0.0 0 0 ? S Jun22 0:02 [migration/0]
root 3 0.0 0.0 0 0 ? SN Jun22 0:18 [ksoftirqd/0]
root 4 0.0 0.0 0 0 ? S Jun22 0:00 [watchdog/0]
如果您在 linux 或其他具有 /proc 文件系统的系统上,在此示例中,您只能看到进程 1 自 6 月 22 日以来一直在运行,但看不到它的启动时间。
stat /proc/<pid>
会给你一个更准确的答案。例如,这是进程 1 的确切时间戳,ps 仅显示为 Jun22:
ohm ~$ stat /proc/1
File: `/proc/1'
Size: 0 Blocks: 0 IO Block: 4096 directory
Device: 3h/3d Inode: 65538 Links: 5
Access: (0555/dr-xr-xr-x) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2008-06-22 15:37:44.347627750 -0700
Modify: 2008-06-22 15:37:44.347627750 -0700
Change: 2008-06-22 15:37:44.347627750 -0700
通过这种方式,您可以获得十个最旧的进程的列表:
ps-精灵 | 排序-r -k12 | 头 -n 10
Jodie C 等人已经指出killall -i
可以使用,如果要使用进程名杀死也可以。但是如果你想通过与 相同的参数杀死pgrep -f
,你需要使用类似下面的东西,使用纯 bash 和/proc
文件系统。
#!/bin/sh
max_age=120 # (seconds)
naughty="$(pgrep -f offlineimap)"
if [[ -n "$naughty" ]]; then # naughty is running
age_in_seconds=$(echo "$(date +%s) - $(stat -c %X /proc/$naughty)" | bc)
if [[ "$age_in_seconds" -ge "$max_age" ]]; then # naughty is too old!
kill -s 9 "$naughty"
fi
fi
这使您可以使用完整的进程名称查找并杀死早于max_age
秒的进程;即,可以通过引用“offlineimap”来终止命名的进程,而此处介绍的解决方案仅适用于字符串“python2”。/usr/bin/python2 offlineimap
killall
Perl 的 Proc::ProcessTable 可以解决问题: http ://search.cpan.org/dist/Proc-ProcessTable/
您可以将其安装在 debian 或 ubuntu 中sudo apt-get install libproc-processtable-perl
这是一个单行:
perl -MProc::ProcessTable -Mstrict -w -e 'my $anHourAgo = time-60*60; my $t = new Proc::ProcessTable;foreach my $p ( @{$t->table} ) { if ($p->start() < $anHourAgo) { print $p->pid, "\n" } }'
或者,更格式化,将其放入一个名为 process.pl 的文件中:
#!/usr/bin/perl -w
use strict;
use Proc::ProcessTable;
my $anHourAgo = time-60*60;
my $t = new Proc::ProcessTable;
foreach my $p ( @{$t->table} ) {
if ($p->start() < $anHourAgo) {
print $p->pid, "\n";
}
}
然后运行perl process.pl
这为您提供了更多的多功能性和 1 秒的开始时间分辨率。
您可以使用bc
加入 mob 答案中的两个命令,并获取自进程开始以来经过的秒数:
echo `date +%s` - `stat -t /proc/<pid> | awk '{print $14}'` | bc
编辑:
在等待长进程运行时感到无聊,这是在摆弄几分钟后出现的结果:
#file: sincetime
#!/bin/bash
init=`stat -t /proc/$1 | awk '{print $14}'`
curr=`date +%s`
seconds=`echo $curr - $init| bc`
name=`cat /proc/$1/cmdline`
echo $name $seconds
如果你把它放在你的路径上并这样称呼它:sincetime
它将打印进程 cmdline 和启动后的秒数。你也可以把它放在你的路径中:
#file: greptime
#!/bin/bash
pidlist=`ps ax | grep -i -E $1 | grep -v grep | awk '{print $1}' | grep -v PID | xargs echo`
for pid in $pidlist; do
sincetime $pid
done
如果你运行:
greptime <pattern>
其中patterns是一个字符串或扩展的正则表达式,它将打印出所有匹配这个模式的进程以及它们启动后的秒数。:)
做一个ps -aef
。这将向您显示该过程开始的时间。然后使用date
命令查找当前时间。计算两者之间的差异以找到过程的年龄。
我做了类似于接受的答案但略有不同的事情,因为我想根据进程名称和运行超过 100 秒的错误进程进行匹配
kill $(ps -o pid,bsdtime -p $(pgrep bad_process) | awk '{ if ($RN > 1 && $2 > 100) { print $1; }}')
stat -t /proc/<pid> | awk '{print $14}'
从纪元开始以秒为单位获取进程的开始时间。与当前时间 ( date +%s
) 比较以获取进程的当前年龄。
使用 ps 是正确的方法。我之前已经做过类似的事情,但手边没有源代码。通常 - ps 有一个选项可以告诉它要显示哪些字段以及按哪些字段排序。您可以按运行时间对输出进行排序,grep 所需的进程,然后将其终止。
高温高压
如果有人在 C 中需要这个,你可以使用 readproc.h 和 libproc:
#include <proc/readproc.h>
#include <proc/sysinfo.h>
float
pid_age(pid_t pid)
{
proc_t proc_info;
int seconds_since_boot = uptime(0,0);
if (!get_proc_stats(pid, &proc_info)) {
return 0.0;
}
// readproc.h comment lies about what proc_t.start_time is. It's
// actually expressed in Hertz ticks since boot
int seconds_since_1970 = time(NULL);
int time_of_boot = seconds_since_1970 - seconds_since_boot;
long t = seconds_since_boot - (unsigned long)(proc_info.start_time / Hertz);
int delta = t;
float days = ((float) delta / (float)(60*60*24));
return days;
}
在某个地方遇到过..认为它简单而有用
可以直接在 crontab 中使用命令,
* * * * * ps -lf | grep "user" | perl -ane '($h,$m,$s) = split /:/,$F
+[13]; kill 9, $F[3] if ($h > 1);'
或者,我们可以将其编写为 shell 脚本,
#!/bin/sh
# longprockill.sh
ps -lf | grep "user" | perl -ane '($h,$m,$s) = split /:/,$F[13]; kill
+ 9, $F[3] if ($h > 1);'
并像这样称呼它为crontab,
* * * * * longprockill.sh
我sincetime
上面的@Rafael S. Calsaverini 版本:
#!/bin/bash
ps --no-headers -o etimes,args "$1"
这会反转输出字段:首先是经过的时间,其次是包含参数的完整命令。这是首选,因为完整的命令可能包含空格。