0

我正在使用 HtmlUnit 从网页获取数据。该网页有多个看起来相同且具有相同 src 值的图像,但每个图像都有不同的 onclick 事件,根据单击的图像将其定向到新页面,而我需要保存数据的正是这个新页面从。我需要遍历图像并单击每个图像以获取 onclick 事件的结果。目前,我的代码循环遍历图像,但每个文件都包含第一张图像的 onclick 输出。有人可以指出我在哪里遗漏了什么吗?我的代码如下:文件名中的客户是我之前在代码中声明的变量,我为每个循环进行更改,以便每个文件具有不同的名称。

DomNodeList<DomElement> iterable2 = page.getElementsByTagName("img");
                       Iterator<DomElement> i3 = iterable2.iterator();
                       int i = 0;
                       while(i3.hasNext())
                       {
                           HtmlElement element1 = null;
                            DomElement anElement = i3.next();
                            if(anElement instanceof HtmlImage)
                            {
                                 HtmlImage input = (HtmlImage) anElement;
                                 if(input.getSrcAttribute().equalsIgnoreCase("customise.gif") )
                                 {
                                      element1 = input;
                                      page2 = element1.click();
                                     webClient.waitForBackgroundJavaScript(30000);
                                     String result = page2.asText();
                                     try {
                                         BufferedWriter out = new BufferedWriter(new FileWriter("Filepath//"+customer+i+".txt"));

                                       out.write(result);
                                       out.close();
                                       } 
                                       catch (IOException e) 
                                       { 
                                       System.out.println("Exception ");

                                       }
                                    i++;
                                 }
                            }

                       }
4

1 回答 1

1

我通过使用在 HtmlUnit 网站上发布的类似问题的解决方案来完成这项工作,可以在此处找到http://htmlunit.10904.n7.nabble.com/Problem-in-clicking-multiple-javaScript-links-on-a -page-td22682.html

使用链接中线程的最终发布中的解决方案,我的代码现在是:

                   page = link3.click();
                   // Added the following line of code
                   Object page1Script  = page.getEnclosingWindow().getScriptObject(); 

                   HtmlPage page2 = null;
                   Iterable<DomElement> iterable2 = page.getElementsByTagName("img");
                   Iterator<DomElement> i3 = iterable2.iterator();
                   int i = 0;
                   while(i3.hasNext())
                   {
                       // Added the following two lines of code
                       page.getEnclosingWindow().setEnclosedPage(page); 
                       page.getEnclosingWindow().setScriptObject(page1Script);

                       HtmlElement element1 = null;
                       page2 = null;
                        DomElement anElement = i3.next();
                        if(anElement instanceof HtmlImage)
                        {
                             HtmlImage input = (HtmlImage) anElement;
                             if(input.getSrcAttribute().equalsIgnoreCase("customize.gif") )
                             {
                                 element1 = input;
                                 page2 = element1.click();
                                 webClient.waitForBackgroundJavaScript(30000);
                                 String result = page2.asText();
                                 try {
                                     BufferedWriter out = new BufferedWriter(new FileWriter("Filepath\\"+customer+i+".txt"));


                                   out.write(result);
                                   out.close();
                                   } 
                                   catch (IOException e) 
                                   { 
                                   System.out.println("Exception ");

                                   }
                                i++;
                             }
                        }

                   }
于 2013-05-08T15:03:27.830 回答