我有一个带有错误转义属性值的任意大 HTML 字符串。我想获得具有正确转义属性值的完整 HTML 字符串。我想在Java中做到这一点。
例如,给定这个错误转义的 HTML 标记:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
我想要这个输出:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
StringEscapeUtils.escapeHtml() 或 replaceAll() 替换所有无效的 HTML 字符,如下所示:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
我希望属性值中的字符正确转义,但 HTML 的其余部分不理会,以便浏览器可以正确处理它。是否有可以处理此问题的 java 库?