我在 HTML 中有多个嵌套引号,如下所示:
<div class="quote-container">
<div class="quote-block">
<div class="quote-container">
<div class="quote-block">
</div>
</div>
<div class="quote-container">
<div class="quote-block">
</div>
</div>
<div class="quote-container">
<div class="quote-block">
</div>
</div>
</div>
</div>
我需要搜索和删除引号。我使用表达式:
<div class="quote-container">.*<div class="quote-block">.*</div>.*</div>
这适用于单引号。但是,多嵌套引号存在问题(上面的示例)。
我的任务是搜索:
<div class="quote-container">.*<div class="quote-block">
加上任何不包含的字符串
<div
并以
.*</div>.*</div>
我尝试了像这样的lookbehind和lookahead断言:
<div class="quote-container">.*<div class="quote-block">.*(?!<div).*</div>.*</div>
但他们不工作。
有没有办法完成我的任务?我需要一个可以在 TextPipe 中使用的 perl 表达式(我将它用于论坛解析,然后我进行文本到语音的转换)。
提前致谢。