我正在尝试解析一个 html,例如:
<html>
<body>
<header>hello</header>
<p>
this is a text<br/>
</p>
</body>
</html>
我想提取
<p>
this is a text<br/>
</p>
我试过 Jsoup:
private String parseTicketReply(String content) {
Document doc = Jsoup.parse(content);
String replybody = "";
// zimbra
if (doc.select("body").size() > 0) {
replybody = doc.select("body").get(0).text();
}
return replybody;
}
我没有得到我想要的。我得到“这是一个文本”。
我尝试了 SAX perser、neko 等……它们都没有给我正确的结果。任何人都知道如何以正确的方式做到这一点?真的很挣扎。提前致谢...