0

我正在使用最新最好的 NotePad++ 版本。RegEx 是否可以删除我不需要的所有文本和标签,只留下我需要的文本和标签?我需要保留的标签如下所示:

<warning>I need this text to remain intact together with accompanying tags.</warning> 

必须有大约 500 个这样的 WARNING 标记对嵌套在各种 XML 级别中。我希望 RegEx 删除这些 WARNING 标签之外存在的所有数据,但不删除打开和关闭警告标签本身或标签内的文本。以下是我测试的四种不同的 RegEx 变体,它们在执行 Find&Replace 操作后都消除了位于警告标签内的文本,因此它们没有帮助:

<warning>[^<>]+</warning>

<warning>[^>]+</warning>

<warning>(.+?)</warning>

<warning>.*?</warning>

我将非常感谢任何有助于我开发 RegEx 的帮助,该 RegEx 将执行我需要执行的数据清理任务。

4

1 回答 1

0

我使用 notepad++ 正则表达式查找和替换下面似乎对我有用。记得选择正则表达式。搜索下面的两个正则表达式并将其替换为空。虽然需要 2 个步骤,但还不完美

第一次替换删除所有不以警告开头的行

第二次替换删除所有空行,只留下带有警告的行

^(?!\s*?<warning>).*?$
^\s*
于 2016-11-03T13:33:19.883 回答