bash - 使用 bash 将一行中的字符串分配给变量

Question

我有以下文本文件，我需要比较每一行的值，即项目 2-4 与项目 5-7。我在这个上坚持使用 bash/awk/sed。

样本数据：

[hartford tmp]$ cat flist
a1 1 2 3 x y z
b1 3 2 1 z y x
c1 1 2 3 1 2 3
d1 4 5 6 6 5 4
e1 a b c a b c
f1 x y z x y z

它适用于以下脚本，但速度慢得令人难以忍受，可能是因为所有的echos.

[hartford tmp]$ cat pdelta.sh
#!/bin/bash

cat flist |while read rec; do
    f1="$(echo $rec | awk '{ print $1 }')"
    f2="$(echo $rec | awk '{ print $2 }')"
    f3="$(echo $rec | awk '{ print $3 }')"
    f4="$(echo $rec | awk '{ print $4 }')"
    f5="$(echo $rec | awk '{ print $5 }')"
    f6="$(echo $rec | awk '{ print $6 }')"
    f7="$(echo $rec | awk '{ print $7 }')"

    if [[ "x${f2} x${f3} x${f4}" != "x${f5} x${f6} x${f7}" ]]; then
            echo "$f1 DOES NOT MATCH"
    fi
done

运行时，输出正是我正在寻找的，但是在处理超过 50k 行的文件时它太慢了。

[hartford]$ ./pdelta.sh
a1 DOES NOT MATCH
b1 DOES NOT MATCH
d1 DOES NOT MATCH

有什么更有效的方法来实现这一点？

score 6 · Accepted Answer

您可以使用awk输出所有匹配的 id：

awk '{ if ($2 == $5 && $3 == $6 && $4 == $7) { print $1 } }' < flist

score 5 · Accepted Answer

5

您可以使用read分配变量：

$ while read f1 f2 f3 f4 f5 f6 f7; do stuff; done <flist

于 2012-09-05T10:22:31.480 回答

score 4 · Accepted Answer

一些修复：

不要cat将单个文件放入管道；只需重定向循环的标准输入。
read可以将每一行拆分为适当的变量。
由于您使用的是 bash[[...]]构造，因此您不需要使用在可能为空的字符串前加上单个字符的旧技巧。直接比较对应值即可。

所以你的循环减少到

while read f1 f2 f3 f4 f5 f6 f7; do
    if [[ $f2 != $f5 || $f3 != $f6 || $f4 != $f7 ]]; then
        echo "$f1 DOES NOT MATCH"
    fi
done < flist

您还可以使用数组来进一步减少它

while read -a f; do
    if [[ ${f[@]:1:3} != ${f[@]:4:3} ]]; then
        echo "${f[0]} DOES NOT MATCH"
    fi
done < flist

该${f[@]:x:y}符号扩展到y从 index 开始的元素x。

score 2 · Accepted Answer

2

使用 perl：

perl -lane 'print $F[0] if @F[1..3] ne @F[4..6]' input_file

于 2012-09-05T10:24:01.127 回答

score 0 · Accepted Answer

Python解决方案：

import sys

for line in sys.stdin:
    f1, f2, f3, f4, f5, f6, f7 = line.split()
    if not (f2, f3, f4) == (f5, f6, f7):
        print f1, "does not match"

用法：

$ python f.py < flist
a1 does not match
b1 does not match
d1 does not match

bash - 使用 bash 将一行中的字符串分配给变量

5 回答 5

Related

Reference