我有一个用 jsoup 制作的文件,看起来像这样
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
我如何将其doc
转换为字符串。
我有一个用 jsoup 制作的文件,看起来像这样
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
我如何将其doc
转换为字符串。
你有没有尝试过:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();
由于Document extends Element它还具有根据API “检索元素的内部 HTML”的方法html()。所以这应该工作:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();
附加信息:
每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过 Document 的方法outputSettings()访问该实例。在那里,您可以使用 setter prettyPrint(true/false)启用/禁用漂亮打印。有关详细信息,请参阅Document和Document.OutputSettings的API
doc.toString()
和 .一样有效doc.outerHtml()
。
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements post = doc.select("div.post-content");
String dd = post.toString();
Document ddd = Jsoup.parse(dd);
将字符串解析为文档后,您可以在其上使用文档功能
Elements scriptTag = ddd.getElementsByTag("script");
System.out.println(scriptTag);