Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试解析具有唯一类属性的 div 元素的 HTML 网页。我需要从中提取信息。它是多个 div 元素,所以我需要遍历 DOM。但我无法识别 div 元素。
在我看来,您应该使用jsoup。它是 Java HTML 解析器。其特点如下。
例如你想得到一个带有类的 DIV 元素foo
foo
Document doc = Jsoup.connect("http://website.com/").get(); Elements divs = doc.select("div.foo");
如果您使用 HtmlCleaner 的 JDom 序列化程序,则可以使用 XPath 表达式来定位 div。