2

我正在尝试从包含 html 源的字符串中提取特殊 div-tag(由他的类名定义)的内容。我认为 Java 的正则表达式功能不像 perl 那样易于使用,对吧?

有没有人这样做过,可以给我一段代码?也许 dom-browsing 是一个很好的解决方案,但我没有找到任何与我的问题相匹配的教程。

4

2 回答 2

1

您可以使用此列表中的HTML Parser或其他一些 HTML 解析库。

于 2009-05-09T19:40:19.340 回答
0

根据您的评论,听起来您有一个一般情况(“爬虫”),因此您正在有效地解析 XML 文件。如果源页面是 xhtml,那么您在各种 XML 库中有多种选择。(例如,JDom)。

于 2009-05-07T23:10:51.747 回答