我正在尝试从包含 html 源的字符串中提取特殊 div-tag(由他的类名定义)的内容。我认为 Java 的正则表达式功能不像 perl 那样易于使用,对吧?
有没有人这样做过,可以给我一段代码?也许 dom-browsing 是一个很好的解决方案,但我没有找到任何与我的问题相匹配的教程。
您可以使用此列表中的HTML Parser或其他一些 HTML 解析库。
根据您的评论,听起来您有一个一般情况(“爬虫”),因此您正在有效地解析 XML 文件。如果源页面是 xhtml,那么您在各种 XML 库中有多种选择。(例如,JDom)。