regex - 正则表达式匹配多行字符串以 x 开头，以 y 结尾并包含 z 但中间不包含 x

Question

最好用一个例子来解释。

这是文字：

<li>hello 
THE WORDS
</li>

<li> cruel </li>

<li> world THE WORDS </li>

我想查找以and contains开头<li>和结尾的字符串。我希望只匹配and 。</li>THE WORDS<li> hello THE WORDS </li><li> world THE WORDS </li>

我尝试了什么：(?s)<li>.*?(THE WORDS).*?</li>

有了这个，第二场比赛是<li> cruel </li> <li> world THE WORDS </li>。

我正在使用崇高文本。

score 5 · Accepted Answer

编辑：对于新的要求，使用这个正则表达式：

(?s)<li>(?:(?!</li>).)*?THE WORDS.*?</li>

解释

原始答案（不同要求）：

使用这个简单的正则表达式（在 Sublime 中测试）：

x+[^xy]*z[^xy]*y+

解释

score 0 · Accepted Answer

以下命令将仅匹配xx hello zz yy,xx world zz yy字符串并仅从这两个字符串中捕获zz。

<li>(?:(?!<\/li>).)*(THE WORDS).*?<\/li>

2 回答 2