我正在使用 java htmlcleaner,我希望只抓取第一个 body 标记及其所有子标记。我想省略 html、head、doctype 标签。
我见过nodeByXpath,但它似乎只适用于ant而不适用于java。有谁知道如何在java中做到这一点?
我正在使用 java htmlcleaner,我希望只抓取第一个 body 标记及其所有子标记。我想省略 html、head、doctype 标签。
我见过nodeByXpath,但它似乎只适用于ant而不适用于java。有谁知道如何在java中做到这一点?