给定以下 XML
<Comment>10 < 100</Comment>
我希望能够正确识别内部<
以便能够将其删除,但我希望保留所有其他内容不变。
我假设这将涉及某种 [?] 选项,但我还没有设法弄清楚在 rubular 上进行试验
注意:我们使用的是 XML 解析器 rexml,但是在上述情况下它会卡住。相反,Nokogiri 被内容中的 & 号呛到了。
这会查找并转换<
后面没有 a 的 s >
:
result = subject.gsub(/<(?![^<>]*>)/, '<')
解释:
< # Match a <
(?! # only if the following regex can't match here:
[^<>]* # any number of characters except angle brackets
> # followed by a closing angle bracket.
) # (End of negative lookahead assertion)