说我有一条线:
终端=“123”密码=“567”
我只想使用 awk 选择数字部分
awk 'match($1, /[0-9]+/){print substr($1, RSTART, RLENGTH)};match($2, /[0-9]+/){print
substr($2, RSTART, RLENGTH)}' file
这给出了期望的结果。
123 567。
但是,必须有其他更好的方法来选择两个数字,而无需编写两个匹配语句。
谢谢。
grep 对你有用吗?
kent$ echo 'Terminal="123" Pwd="567"'|grep -o '[0-9]\+'
123
567
使用 awk 又快又脏:
awk -F'[^0-9]*' '{$1=$1}7'
测试:
kent$ awk -F'[^0-9]*' '{$1=$1}7'<<< 'Terminal="123" Pwd="567"'
123 567
或者:
kent$ awk '{gsub(/[^0-9 ]/,"")}7'<<< 'Terminal="123" Pwd="567"'
123 567
这是使用 awk 的另一种方法。我们将字段分隔符设置为"
$ echo 'Terminal="123" Pwd="567"' | awk -F\" '{print $2, $4}'
123 567
这是一个不错的小解决方案awk
:
awk '{gsub("[^0-9]+"," "); print}'
只需将所有连续的非数字字符转换为一个空格,因此在数字序列之前留一个空格123
。
我遇到了类似的问题,但我的模式更复杂,所以我无法解决我的问题gsub
或类似问题。我写了一个递归函数和一个包装器。它在一个变量中找到多个匹配项并将它们打印出来,并用空格分隔:
awk '
function rec_wrap(str)
{
matches=""
return rec_func(str)
}
function rec_func(str2)
{
where=match(str2, /RE/)
if(where!=0) {
matches=(matches substr(str2, RSTART, RLENGTH) " ")
rec_func(substr(str2, RSTART+RLENGTH, length(str2)))
}
return matches
}
{print rec_wrap($1)}
' file.txt
需要包装器rec_wrap
来清空变量matches
。函数match
将最左边匹配的位置和长度写入变量RSTART
,RLENGTH
然后将匹配提取substr
并附加到变量matches
。然后该函数rec_func
以字符串的其余部分str2
作为参数调用自身,直到match
找不到匹配项为止。