7

我正在做一些项目,我需要从不同的网站上废弃一些信息。我正在HtmlUnit为此目的使用,但问题是我无法遍历一页上的元素。

例子:

  <div id="some_id">

      <div>

        <div>

           <div>

              ......
                       many divs in between
              ......

               <div id="my_target_div"> some information </div>

                ........

                ........

                 </div>

现在如何获取div其中的 idmy_target_div 和信息div

4

2 回答 2

5

使用getHtmlElementById

检查文档

一个例子:

@Test
public void getElements() throws Exception {
    final WebClient webClient = new WebClient();

    final HtmlPage page = webClient.getPage("http://some_url");
    final HtmlDivision div = page.getHtmlElementById("my_target_div");

    webClient.closeAllWindows();
}

资源。

于 2013-08-07T12:18:31.090 回答
2
WebClient webClient = new WebClient();
        HtmlPage page;
  HtmlElement div= (HtmlElement) page2.getFirstByXPath("//div[@id='my_target_div']");

这将解决您的问题。

于 2016-11-16T06:46:40.397 回答