我正在尝试浏览网页正文上的每个 html 标签,看看它是否有文本。如果是这样,我想打印出该文本:
Document doc = Jsoup.connect(site).get();
Elements e = doc.body().getAllElements();
for (int i=0; i<e.size(); i++){
if(doc.body().child(i).hasText()){
System.out.println(doc.body().child(i).text());
}
}
以上工作,但不是我想要的。似乎 child() 方法不是细粒度的,因为它将多个“div 类”元素聚集在一起。如何以更细粒度的方式遍历 DOM 正文以查看每个标签的文本是什么?
先感谢您。