我需要一个正则表达式来查找所有不是 xml-tags 的 '<' 或 '>'。
例子:
<tag1>W<E><E</tag1>Z<>S
应该找到
<><<>
例子:
<tag1>W<E><E</E></tag1>Z<>S
应该找到
<<>
所以,任何“<”或“>”不在标签中的命中(是的,我们也有应该考虑到的自动关闭标签:)
编辑#2: 我最后要做的是用 html 编码的值替换所有匹配项。
编辑#3:
所以我想要做的是从包含带有一些附加标签(很少有已知标签)的 HTML 的文本中获取标签中不包含的所有 '<' 和 '>' 。
示例(我想找到的粗体,以便我可以用它们的编码值替换它们):
<div>
<a href="link">Link with < characters</a>
<knownTag>Text with character ></knownTag>
<knownTag>Text < again ></knownTag>
<div>
结果应该是:
<div>
<a href="link">Link with < characters</a>
<knownTag>Text with character ></knownTag>
<knownTag>Text < again ></knownTag>
<div>
关于如何解决这个问题的任何想法?