9

我想删除 htmldivtable表格标签以及其中的任何内容(孩子),最好的方法是什么?

我尝试像这样遍历文档,但它不起作用,在 Jsoup 文档中它说node.remove()从 DOM 和他的孩子的元素中删除元素:

doc.traverse(new NodeVisitor() {
                @Override
                public void head(Node node, int i) {

                }

                @Override
                public void tail(Node node, int i) {
                    //Log.i(TAG,"node: "+node.nodeName());
                    if( node.nodeName().compareTo("table") == 0 ||
                            node.nodeName().compareTo("div") == 0 )
                       node.remove();

                }
            });
4

2 回答 2

19

你试过Elements类的remove()功能吗?

Document doc = Jsoup.parse(html);
doc.select("div").remove();
doc.select("table").remove();

这应该选择并删除所有<div><table>元素。

于 2013-11-12T14:00:18.250 回答
1
Document doc = Jsoup.parse(html);
doc.select("table *").remove();
于 2017-12-05T03:17:44.240 回答