我只是想转义 HTML 中所有 PRE 标记的内容。为此,我目前正在使用 JSoup,它按预期工作,除了一件事。我正在使用的示例输入字符串:
<pre>public List<Article> methodName() {
...
}</pre>
所以从这个字符串中,我只想逃避<
and>
字符。我目前正在使用 JSoup 执行此操作,如下所示(我正在使用 Spring HtmlUtils 进行转义):
Document document = Jsoup.parse(string);
document.outputSettings().prettyPrint(false);
Elements codeTags = document.select("pre");
for (Element codeTag : codeTags) {
codeTag.html(HtmlUtils.htmlEscape(codeTag.html()));
}
除了上面的输入字符串,它似乎按预期工作,它似乎自动更改和“修复”<Article>
文本,如下所示:
<pre>public List<article> methodName() {
...
}</article></pre>
我知道 JSoup 正在解析 HTML,但这不是我在这种情况下想要的行为,我能做些什么来告诉 JSoup 不要尝试自动修复我的 HTML 吗?我应该首先使用 JSoup 吗?