我有一个用 BBEdit 编辑的大 XML 文件。
在 XML 文件中,它是旧日记的数字娱乐,是包含在注释标签中的文本。
<note>Example of a note.</note>
然而,一些注释标签的引号包含在嵌套在其中的引号标签中。
<note>Example of a note, but <quote>"here is a quotation within the note"</quote></note>
我需要从注释标签中删除所有引用实例,同时保留引用标签的实际内容。所以这个例子会变成:
<note>Example of a note, but "here is a quotation within the note"</note>
我已经在 BBEdit 中使用 GREP 成功删除了其中的一些,但我开始遇到更复杂的注释标签,这些标签跨越多行或在两组不同的标签之间有文本。例如:
<note>Example of a note, <quote>"with a quotation"</quote> and a <quote>"second quotation"</quote> along with some text outside of the quotation before the end of the note.</note>
有些报价可以持续超过 10 行。在我的正则表达式中使用 \r 似乎没有帮助。
我还应该说引用标签可以存在于注释标签之外,这排除了只是批量查找 /?quote 并删除它的可能性。我仍然需要在文档中使用引号标签,而不是在注释标签中。
非常感谢您的帮助。