我目前正在使用 Jsoup 来解析 html。代码很简单:
Document doc = null;
try{
doc = Jsoup.connect(link).get();
}
catch (Exception e) {
//System.out.println("Some error occured.");
textView.setText(e.getMessage());
}
它确实为我提供了我想要的网页,稍后我可以使用它的 getElementsByTag 方法等从该网页中提取我需要的数据。但是,我只想使用部分网页,例如,我希望放弃 < 之后的所有内容!-- / foo --> 在我的网页中。(实际上它在 < 和 ! 之间没有空格,但我不能在这里输入。)有没有办法在该字符串之后放弃网页并只获取我想要的部分的新文档?我检查了食谱,但它似乎只处理网页结构,所以我不太确定是否可以执行字符串删除之类的操作。感谢您的阅读。