-1

我在 AIX 环境中有一个日志文件,其中包含如下行

10.100.108.23 100.10.10.11 - [05/Dec/2012:09:35:27 +0000] "GET /chgs/checkprofile/checkServlet?requestType=signPart1&off=false&oquestions=true&userid=false&source=false&link=%23&country=us&language=en&origin=&displayLayer=no HTTP/1.1" 200 8904 "https://www.test.com/services/request/Home.action" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C)" "PD-ERR=; rlang=nl_NL;

我需要从模式之后的每一行中分别找到国家和&country语言&language。由于我是 shell 脚本的新手,我尝试使用 grep 和 awk 脚本来实现这一点,但没有运气。

4

2 回答 2

2
awk -F"&" '{for(i=1;i<=NF;i++)if($i~/country/ ||$i~/language/){split($i,a,"=");printf a[2]" "}}' your_file

或者你可以使用 sed:

sed -e 's/.*country=//g;s/language=\([^\&]*\)&.*/\1/g' your_file

删除该&符号:

> sed -e 's/.*country=//g;s/&language=\([^\&]*\)&.*/ \1/g' temp
us en

你可以读这个

于 2012-12-07T11:47:15.943 回答
1

使用grep

$ grep -Eo '(country|language)=[^&]*' file
country=us
language=en

$ grep -Po '(?<=country=|language=)[^&]*' file
us
en

#  Grep Options

-o, --only-matching       show only the part of a line matching PATTERN
-E, --extended-regexp     PATTERN is an extended regular expression (ERE)
-P, --perl-regexp         PATTERN is a Perl regular expression

使用sed

sed -E 's/.*country=([^&]*).*language=([^&]*).*/\1 \2/g' file
us en 

# Sed option

-E use extended regular expression
于 2012-12-07T11:48:17.777 回答