3

给定以下 XML

<Comment>10 < 100</Comment>

我希望能够正确识别内部<以便能够将其删除,但我希望保留所有其他内容不变。

我假设这将涉及某种 [?] 选项,但我还没有设法弄清楚在 rubular 上进行试验

注意:我们使用的是 XML 解析器 rexml,但是在上述情况下它会卡住。相反,Nokogiri 被内容中的 & 号呛到了。

4

1 回答 1

3

这会查找并转换<后面没有 a 的 s >

result = subject.gsub(/<(?![^<>]*>)/, '&lt;')

解释:

<        # Match a <
(?!      # only if the following regex can't match here:
 [^<>]*  # any number of characters except angle brackets
 >       # followed by a closing angle bracket.
)        # (End of negative lookahead assertion)
于 2013-06-06T15:04:19.983 回答