2

我正在使用 jsoup.parse() 加载 html 文档。我只想修改文档中的 url 引用,然后写出来。不幸的是,文档中的文本区域也被修改了。我怎样才能写出只包含我的更改而没有其他更改的修改后的文档?目前正在写出 doc.html()。

<textarea class="code_input" id="textareaCode" wrap="logical" rows="10" cols="50">
<!DOCTYPE html>
<html>
<head>
<script>
</script>
</head>
</textarea>

<textarea class="code_input" id="textareaCode" wrap="logical" rows="10" cols="50">&lt;!DOCTYPE html&gt;
&lt;html&gt;
&lt;head&gt;
&lt;script&gt;
&lt;/script&gt;
&lt;/head&gt;
&lt;/html&gt;
</textarea> 
4

1 回答 1

0

我想我明白你的意思。您希望取消转义内部的 html 实体,<textarea>以便将它们保留为适当的标签。

查看Parser.unescapeEntities()函数(请参阅 Jsoup文档)。

使用示例 html 的示例:

Document doc = Jsoup.parse(html);
String s = Parser.unescapeEntities(doc.html(), true);
System.out.println(s);

将打印出:

<textarea class="code_input" id="textareaCode" wrap="logical" rows="10" cols="50">
   <!DOCTYPE html>
   <html>
   <head>
   <script>
   </script>
   </head>
</textarea>

让我知道这是否适合您。

于 2013-11-09T02:22:50.787 回答