我正在使用 JSOUP 解析 HTML,其中也包含一些元素。但是,当我打印生成的 doc.html() 时,而不是:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
我正进入(状态 :
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
在代码中,我进行如下操作:
for (final Element src : doc.select("script")) {
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }
我正在使用 UTF-8 字符集。
如何直接获取未转义的文本?提前致谢 !