0

我需要在代码块(当然可以包含换行符)中找到包含字符串的文件的名称,或者更具体地说:构造函数中的某些方法调用(我们称之为methodName)。我需要查看当前目录及其子目录中的所有 java 代码文件。

可能的匹配是:

public myClass() {
  a(1);
  b();
  myMethod("abc");
  c(5);
}

这是我到目前为止提出的表达方式:

find . -name *.java | xargs nawk '{print $0 "~("FILENAME")"}' | tr -d "\n" | grep -s -i -o 'public \w\+([^)]*).*methodName([^~]*~([^)]*)'

所以...
- *.java 文件是递归找到的
- 每一行都被打印出来,旁边是它所属的文件名(只是为了跟踪它是在哪里找到
的) - 删除 \n 以便能够使用 grep在一个块中
- 然后查找methodName

问题是每次我需要使用 .* 时,我都必须将表达式更改为下一个表达式的否定,然后是下一个表达式。例如:如果我需要.*\~,我需要做([^~]*~......这不是很好,但我可以忍受它。问题来自methodName,因为否定该字符串会更痛苦。

有任何想法吗?可以用正则表达式完成吗?

4

2 回答 2

1

你正在与贪婪作斗争。.*默认情况下会变得贪婪,因此它将尽可能多地消耗,成为一切。只有在它消耗完所有内容后,它才会尝试匹配表达式的下一部分m并回溯,直到匹配为止。如果它确实找到了模式的其余部分,它将匹配从 ('public \w+([^)]*)') 前面的模式的第一次出现到( ).*后面的模式的最后一次出现的所有内容。.*methodName([^~]*~([^)]*)

解决方法是让.*lazy: .*?,给你完整的表达方式public \w\+([^)]*).*?methodName([^~]*~([^)]*)

有趣的是,在您使用否定字符类的情况下,您使用否定字符类的解决方法是首选解决方案,但是,是的,做类似的事情methodName可能会变得有点笨拙。

请参阅:懒惰而不是贪婪

于 2012-07-07T05:35:45.800 回答
0

尝试使用 sed 代替 grep。以下内容可能会帮助您入门:

find . -name *.java | xargs awk '{print $0 "~("FILENAME")"}' | \
sed -n '                                  # start sed with automatic printing suppressed
/public \w\+/,/^}/H                       # append all constructors to hold space
$!d                                       # stop here unless this is the last line
g                                         # copy hold space to pattern space
s/.*methodName([^~]*~(\([^)]*\)).*/\1/p   # if methodName is called, print the file name
'
于 2012-07-06T21:51:29.777 回答