7

我知道 egrep 有一种非常有用的方法,可以通过以下方式将两个表达式组合在一起:

egrep "pattern1.*pattern2"|egrep "pattern2.*pattern1" filename.txt|wc -l

但是,在搜索三个表达式时,是否有一种简单的方法可以使用 egrep 的 AND 运算符,因为当您添加额外的表达式时,排列会呈指数增长。

我知道使用它的另一种方法,sort|uniq -d 但是我正在寻找一个更简单的解决方案。

编辑:

我目前的搜索方式将产生五个总结果:

#!/bin/bash
pid=$$
grep -i "angio" rtrans.txt|sort|uniq|egrep -o "^[0-9]+ [0-9]+ " > /tmp/$pid.1.tmp
grep -i "cardio" rtrans.txt|sort|uniq|egrep -o "^[0-9]+ [0-9]+ " > /tmp/$pid.2.tmp
grep -i "pulmonary" rtrans.txt|sort|uniq|egrep -o "^[0-9]+ [0-9]+ " > /tmp/$pid.3.tmp
cat /tmp/$pid.1.tmp /tmp/$pid.2.tmp|sort|uniq -d > /tmp/$pid.4.tmp
cat /tmp/$pid.4.tmp /tmp/$pid.3.tmp|sort|uniq -d > /tmp/$pid.5.tmp
egrep -o "^[0-9]+ [0-9]+ " /tmp/$pid.5.tmp|getDoc.mps > /tmp/$pid.6.tmp
head -10 /tmp/$pid.6.tmp

mumps@debianMumpsISR:~/Medline2012$ AngioAndCardioAndPulmonary.script 
1514 Structural composition of central pulmonary arteries. Growth potential after surgical shunts.
1517 Patterns of pulmonary arterial anatomy and blood supply in complex congenital heart disease
with pulmonary atresia
3034 Controlled reperfusion following regional ischemia.
3481 Anaesthetic management for oophorectomy in pulmonary lymphangiomyomatosis.
3547 A comparison of methods for limiting myocardial infarct expansion during acute reperfusion--
primary role of unload

尽管:

mumps@debianMumpsISR:~/Medline2012$ grep "angio" rtrans.txt|grep "cardio" rtrans.txt|grep "pulmonary" rtrans.txt|wc -l
185

产生 185 行文本,因为它只采用肺部搜索的值,而不是所有三个搜索。

4

3 回答 3

9

how about

grep "pattern1" file|grep "pattern2"|grep "pattern3" 

this will give those lines that contain p1, p2 and p3. but with arbitrary order.

于 2013-03-02T17:28:36.420 回答
1

肯特的方法与

grep "pattern1" file|grep "pattern2"|grep "pattern3" 

是正确的,它应该更快,只是为了记录我想发布一个替代方案,它egrep可以在不冒泡的情况下做同样的事情:

egrep "pattern1.*pattern2|pattern2.*pattern1"

寻找p1 followed by p2or p2 followed by p1

于 2017-03-16T12:37:07.247 回答
0

最初的问题是关于为什么他的 egrep 命令不起作用。

egrep "pattern1.*pattern2"|egrep "pattern2.*pattern1" filename.txt|wc -l

Kent 和 Stanislav 通过将 filename.txt 放在前面来指出语法错误是正确的。但这并不能解决最初的问题。

Bob 的“当前方式”(4 年前)是一种多命令方法,可以在不同的行上 grep 出不同的关键字。换句话说,他的脚本正在寻找一组包含他的任何搜索词的行。其他提议的解决方案只会导致包含他所有搜索词的行,这似乎不是他的意图。

相反,他可以使用一行 egrep 来查找任何术语,如下所示:

egrep -e 'pattern1|pattern2' filename.txt
于 2017-07-28T19:05:35.217 回答