我有一堆日志文件。我需要找出一个字符串在所有文件中出现了多少次。
grep -c string *
返回
...
file1:1
file2:0
file3:0
...
使用管道,我只能获取出现一次或多次的文件:
grep -c string * | grep -v :0
...
file4:5
file5:1
file6:2
...
我怎样才能只获得组合计数?(如果它返回file4:5, file5:1, file6:2
,我想返回 8。)
我有一堆日志文件。我需要找出一个字符串在所有文件中出现了多少次。
grep -c string *
返回
...
file1:1
file2:0
file3:0
...
使用管道,我只能获取出现一次或多次的文件:
grep -c string * | grep -v :0
...
file4:5
file5:1
file6:2
...
我怎样才能只获得组合计数?(如果它返回file4:5, file5:1, file6:2
,我想返回 8。)
这适用于每行多次出现:
grep -o string * | wc -l
cat * | grep -c string
grep -oh string * | wc -w
将计算一行中的多次出现
不要使用 -c,只需将其通过管道传递给 wc -l。
grep string * | wc -l
这将在一行中列出每个出现,然后计算行数。
但是,这将错过字符串在一行上出现 2 次以上的情况。
cat * | grep -c string
的罕见有用的应用程序之一cat
。
您可以添加-R
到递归搜索(并避免使用 cat)并-I
忽略二进制文件。
grep -RIc string .
与之前所有答案不同的东西:
perl -lne '$count++ for m/<pattern>/g;END{print $count}' *
强制 AWK 解决方案:
grep -c string * | awk 'BEGIN{FS=":"}{x+=$2}END{print x}'
请注意您的文件名是否包含“:”。
AWK 解决方案还可以处理包括冒号在内的文件名:
grep -c string * | sed -r 's/^.*://' | awk 'BEGIN{}{x+=$1}END{print x}'
请记住,此方法仍然无法string
在同一行上找到多次出现的。
如果您想要每个文件的出现次数(例如字符串“tcp”):
grep -RIci "tcp" . | awk -v FS=":" -v OFS="\t" '$2>0 { print $2, $1 }' | sort -hr
示例输出:
53 ./HTTPClient/src/HTTPClient.cpp
21 ./WiFi/src/WiFiSTA.cpp
19 ./WiFi/src/ETH.cpp
13 ./WiFi/src/WiFiAP.cpp
4 ./WiFi/src/WiFiClient.cpp
4 ./HTTPClient/src/HTTPClient.h
3 ./WiFi/src/WiFiGeneric.cpp
2 ./WiFi/examples/WiFiClientBasic/WiFiClientBasic.ino
2 ./WiFiClientSecure/src/ssl_client.cpp
1 ./WiFi/src/WiFiServer.cpp
解释:
grep -RIci NEEDLE .
- 从当前目录递归查找字符串 NEEDLE(遵循符号链接),忽略二进制文件,计算出现次数,忽略大小写awk ...
- 此命令忽略出现次数为零的文件并格式化行sort -hr
- 按第一列中的数字以相反的顺序对行进行排序当然,它也适用于带有选项-c
(计数)的其他 grep 命令。例如:
grep -c "tcp" *.txt | awk -v FS=":" -v OFS="\t" '$2>0 { print $2, $1 }' | sort -hr
您可以使用简单grep
的方法来有效地捕获出现次数。我将使用该-i
选项来确保STRING/StrING/string
正确捕获。
给出文件名的命令行:
grep -oci string * | grep -v :0
如果有一个文件没有出现,则删除文件名并打印 0 的命令行:
grep -ochi string *
短递归变体:
find . -type f -exec cat {} + | grep -c 'string'
这是一种比 grep AWK 更快的替代方法,它<url>
在目录中的 XML 文件集合中处理每行的多个匹配项:
awk '/<url>/{m=gsub("<url>","");total+=m}END{print total}' some_directory/*.xml
这适用于某些 XML 文件没有换行符的情况。
我用 grep for windows 测试的 Grep 唯一解决方案:
grep -ro "pattern to find in files" "Directory to recursively search" | grep -c "pattern to find in files"
即使一行中有多个,此解决方案也会计算所有出现次数。-r
递归搜索目录,-o
将“仅显示与 PATTERN 匹配的行的一部分”——这是在一行上拆分多个出现并让 grep 在新行上打印每个匹配项的原因;然后通过管道将这些换行符分隔的结果返回到 grep 中,-c
以使用相同的模式计算出现次数。
另一个使用基本命令行函数处理每行多次出现的单行器。
cat * |sed s/string/\\\nstring\ /g |grep string |wc -l
awk -v RS='' -v FPAT='fast' '{print NF,FILENAME}' <file1..N>
取一个字符串,使其成为一个快速的实例,然后打印带有文件名的字段数。