27

我有一个用 jsoup 制作的文件,看起来像这样

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

我如何将其doc转换为字符串。

4

3 回答 3

42

你有没有尝试过:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

由于Document extends Element它还具有根据API “检索元素的内部 HTML”的方法html()。所以这应该工作:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

附加信息:

每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过 Document 的方法outputSettings()访问该实例。在那里,您可以使用 setter prettyPrint(true/false)启用/禁用漂亮打印。有关详细信息,请参阅DocumentDocument.OutputSettings的API

于 2011-07-28T20:17:59.957 回答
9

doc.toString()和 .一样有效doc.outerHtml()

于 2011-07-28T20:20:25.893 回答
0
 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

将字符串解析为文档后,您可以在其上使用文档功能

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);
于 2014-09-03T03:10:47.350 回答