3

我有一个在命令行上运行良好的 Perl 单行代码:

perl -nle 'm"\w+:x:\d+:\d+:\S+:/S+:(\S+)$" and $h{$1}++; END{ print "$_: $h{$_}" foreach sort { $h{$b} <=> $h{$a} } keys %h }' /etc/textfile

我已经把它放到了一个名为的 shell 文件shell.sh中,这样下一个人就不必复制/粘贴并且可以运行它:

#!/bin/sh
perl -nle 'm"\w+:x:\d+:\d+:\S+:/S+:(\S+)$" and $h{$1}++; END{ print "$_: $h{$_}" foreach sort { $h{$b} <=> $h{$a} } keys %h }' /etc/textfile

我尝试在命令行上运行它并没有得到任何结果;它只是加载一个没有输出的新提示。有人看到我做错了什么吗?

以下是一些系统规格:

Linux 版本 2.6.32-220.13.1.el6.x86_64

(gcc 版本 4.4.6 20110731 (Red Hat 4.4.6-3) (GCC)

GNU bash,版本 4.1.2(1)-release (x86_64-redhat-linux-gnu)

这是文本文件中的一些内容:

rfink:x:140:140:rat fink:/var/lib/rfink:/sbin/nologin                                 
edible:x:16252:10001:eric idle:/users/eidle/:/bin/bash                                       
tsawyer:x:30855:10001:tom sawyer:/users/tsawyer/:/bin/bash                                
karthur:x:30886:10001:King Arthur:/users/karthur/:/bin/bash                                         
karthur:x:30886:10001:king arthur:/users/karthur/:/bin/bash                                         
jcash:x:30887:10001:john cash:/users/jcash/:/bin/bash                              
hpotter:x:30887:10001:harry potter:/users/hpotter/:/bin/bash                              
triddle:x:30956:10001:tom riddle:/users/triddle/:/bin/bash 
4

2 回答 2

3

快速回答

perl -nle 'm"\w+:x:\d+:\d+:[^:]+:\S+:(\S+)\s*$" and $h{$1}++;
  END{ print "$_: $h{$_}" foreach sort { $h{$b} <=> $h{$a} } keys %h }' \
  /etc/textfile

您的正则表达式有三个问题。

  1. 组 ID 后面的字段可能包含空格,因此将该子模式替换为[^:]+以匹配一个或多个非冒号字符。
  2. 您在子模式中使用了错误的斜杠来匹配主目录。
  3. \s*在每行之前插入$以允许可选的尾随空格。

输出:

/bin/bash: 7
/sbin/nologin: 1

其他方法

Perl 有一个 awk 模式,它允许

perl -F: -lane '++$sh{$F[-1]};
  END{print "$_: $sh{$_}" for sort { $sh{$b} <=> $sh{$a} } keys %sh}' \
  /etc/textfile

必须删除尾随空格似乎取消了语法优势。

perl -F: -lane '($sh = pop @F) =~ s/\s+$//; ++$sh{$sh};
  END{print "$_: $sh{$_}" for sort { $sh{$b} <=> $sh{$a} } keys %sh}' \
  /etc/textfile

您可以使用管道来获得所有世界中最好的:

perl -pe 's/[^\S\n]+$//' /etc/textfile |
  perl -F: -lane 'print $F[-1]' |
    sort | uniq -c | sort -nr

输出转置列,但您得到相同的信息。

请注意在管道的第一个命令中使用正则表达式双重否定技术来删除除换行符以外的所有空格。

      7 /bin/bash
      1 /sbin/nologin

作为 shell 脚本

你的问题需要一个 shell 脚本,所以——为了让daxim 的回答更动听——那就是

#! /bin/sh

perl -MUser::pwent -le \
  '$_->shell && print $_->shell while $_ = getpwent' |
  sort | uniq -c | sort -nr

请注意,这不处理名为0.

如果您不一定要阅读系统/etc/passwd,那么您的脚本将变为

#! /bin/sh

if [ $# -eq 0 ]; then
  echo Usage: $0 passwd-file .. 1>&2
  exit 1
fi

perl -pe 's/[^\S\n]+$//' "$@" |
  perl -lne 'm|\w+:x:\d+:\d+:[^:]+:\S+:(\S+)$| && print $1' |
    sort | uniq -c | sort -nr

不同的系统使用不同的格式,所以我建议像上面那样确定你的期望,而不是盲目地打印最后一个字段,不管它是什么。这可能意味着应对偶尔的空输出。

于 2012-05-21T15:48:02.003 回答
2

当存在专门的解析器时,避免使用临时正则表达式。

perl -MUser::pwent=getpwent -e'
    while (my $pwent = getpwent) { $h{ $pwent->shell }++; }
    END { print "$_: $h{$_}\n" for sort { $h{$b} <=> $h{$a} } keys %h }
'

split当更简单的结构(例如, index/ substr)可以使用时,请避免使用 reg-ex unpack。在这里,我利用了autosplit

perl -F: -lane'
    $h{ $F[-1] }++;
    END { print "$_: $h{$_}" for sort { $h{$b} <=> $h{$a} } keys %h }
' /etc/textfile

这使得程序更短、更易读。

于 2012-05-21T16:31:57.053 回答