java - 使用正则表达式匹配多个组的惰性（不贪婪）

Question

我想获取<tag></tag>标签对之间任何值的内容。

<tag>
This is one block of text
</tag>

<tag>
This is another one
</tag>

我想出的正则表达式是

/<tag>(.*)</tag>/m

但是，它似乎很贪婪，并且会捕获括号内的所有内容，直到最后一个</tag>. 我希望它尽可能地懒惰，以便每次看到结束标签时，它都会将其视为匹配组并重新开始。

如何编写正则表达式，以便能够在给定场景中获得多个匹配项？

我在以下链接中包含了我所描述的示例

注意：这不是 XML，也不是真正基于任何现有的标准格式。我不需要任何复杂的东西，比如带有漂亮解析器的成熟库。

score 14 · Accepted Answer

使用正则表达式模式：

/<tag>(.*?)<\/tag>/im

懒惰（非贪婪）是.*?，不是.*。

要查找多个匹配项，请使用：

string.scan(/<tag>(.*?)<\/tag>/im)

1 回答 1