我需要一个来自 html 站点的特定 'div'-tag(由 'id' 标识)。为了解析我正在使用cyberneko的页面。
def doc = new XmlParser( new org.cyberneko.html.parsers.SAXParser() ).parse(htmlFile)
divTag = doc.depthFirst().DIV.find{ it['@id'] == tagId }
到目前为止没问题,但最后我不需要XML,而是整个'div'标签的原始内容。不幸的是,我无法弄清楚如何做到这一点......