8

我用过这段代码:

String innerHtml = Jsoup.parse(htmlCode,"ISO-8859-1").select("body").html();

但它只删除<html>标签

内的任何HTML标签body仍然会出现

4

2 回答 2

10

使用.text()而不是.html()获取元素及其所有子元素的组合文本。

于 2013-03-15T16:08:31.430 回答
8

尝试使用.text()

Jsoup.parse(htmlCode,"ISO-8859-1").select("body").text();

而不是.html().

于 2013-03-15T16:07:52.790 回答