首先让我说我不想只打印重复的行,也不想删除它们。
我正在尝试将 grep 与模式文件一起使用来解析大型数据文件。
例如,Pattern 文件可能如下所示:
1243
1234
1234
1234
1354
1356
1356
1677
等具有更多单一和重复的条目。
输入数据文件可能如下所示:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
ttttt 1555 bbbbbb
ppppp 1354 pppppp
yyyyy 3333 zzzzzz
qqqqq 1677 eeeeee
iiiii 4444 iiiiii
等27000行。
当我使用
grep -f 'Patternfile.txt' 'Inputfile.txt' > 'Outputfile.txt'
我得到一个类似于这样的输出文件:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
ppppp 1354 pppppp
我怎样才能让它也报告重复项,所以我最终得到这样的结果?:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
yyyyy 1234 vvvvvv
yyyyy 1234 vvvvvv
ppppp 1354 pppppp
qqqqq 1677 zzzzzz
此外,如果模式文件中的查询与输入文件中的子字符串不匹配,我还想打印一个空行。
谢谢!