10

我想获取<tag></tag>标签对之间任何值的内容。

<tag>
This is one block of text
</tag>

<tag>
This is another one
</tag>

我想出的正则表达式是

/<tag>(.*)</tag>/m

但是,它似乎很贪婪,并且会捕获括号内的所有内容,直到最后一个</tag>. 我希望它尽可能地懒惰,以便每次看到结束标签时,它都会将其视为匹配组并重新开始。

如何编写正则表达式,以便能够在给定场景中获得多个匹配项?

我在以下链接中包含了我所描述的示例

http://rubular.com/r/JW5M3rnqIE

注意:这不是 XML,也不是真正基于任何现有的标准格式。我不需要任何复杂的东西,比如带有漂亮解析器的成熟库。

4

1 回答 1

14

使用正则表达式模式:

/<tag>(.*?)<\/tag>/im

懒惰(非贪婪)是.*?,不是.*

要查找多个匹配项,请使用:

string.scan(/<tag>(.*?)<\/tag>/im) 
于 2012-10-14T18:39:15.857 回答