2

我尝试使用 HtmlUnit 填写和提交 HTML 表单。使用 加载一个select元素及其选项<body onLoad="...">

我的问题:我无法通过 getSelectByName、getChildElements 等检索此元素(引发 ElementNotFoundException),尽管在查看org.apache.http.wire日志select时可以看到数据已加载。

打印时page.asXml(),我只看到未更改的 HTML 文档。

我的代码:

public static void main(final String[] args) throws Exception {

    final URL url = new URL("http://www.rce-event.de/modules/meldung/annahme.php?oid=471&pid=1&ac=d98482bbf174f62eaaa4664c&tkey=468&portal=www.dachau.de&ortsbox=1&callpopup=1");

    final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_3_6); // tried also FIREFOX_3
    webClient.setAjaxController(new NicelyResynchronizingAjaxController());

    final HtmlPage page = webClient.getPage(url);
    webClient.waitForBackgroundJavaScript(10000); // tried also Thread.sleep()

    // tried also to use webClient.getCurrentWindow().getEnclosedPage() instead of 'page'
    final HtmlForm form = page.getFormByName("formular");

    // ElementNotFoundException thrown here:
    final HtmlSelect select = form.getSelectByName("event.theme");
    final HtmlOption option = select.getOptionByText("Sport/Freizeit");
    final Page newPage = select.setSelectedAttribute(option, false);

    // submit etc.
}

堆栈跟踪:

Exception in thread "main" com.gargoylesoftware.htmlunit.ElementNotFoundException: elementName=[select] attributeName=[name] attributeValue=[event.theme]
at com.gargoylesoftware.htmlunit.html.HtmlForm.getSelectByName(HtmlForm.java:449)
at Xyzzy.main(Xyzzy.java:58)

我尝试了这里这里这里(甚至更多)写的所有内容,但没有任何成功。

更新:

我简化了我的代码并开始了赏金。

4

1 回答 1

2

您的问题是,名为“event.theme”的选择仅在名为“event.datapool”的选择的值为“1”时才被加载。

因此,您需要将“event.datapool”选择值更改为“1”:

[........]
final HtmlSelect selectBase = form.getSelectByName("event.datapool");
final HtmlOption optionBase = selectBase.getOptionByText("Freizeit / Tourismus");
final Page newPage = selectBase.setSelectedAttribute(optionBase, true);
[........]

但是您可能会遇到问题,因为选择“event.theme”的“HTML”数据是通过 ajax 加载的。所以我不认为你的java“HtmlSelect”类会像Javascript在实际用户交互中那样加载表单中的select“event.theme”。

解决方案是:

1. Load your page "http://www.rce-event.de/modules/meldung/annahme.php?oid=471&pid=1&ac=d98482bbf174f62eaaa4664c&tkey=468&portal=www.dachau.de&ortsbox=1&callpopup=1" 
2. Load the page "http://www.rce-event.de/modules/meldung/js/xmlhttp_querys.php?get_kat=1&time=1338409551228&id=1&block=kat" > which will return the "event.theme" select data/values
3. Then use the data loaded in step 2 to update the page loaded in step 1 by inserting a "select list with id and name set to <event.theme>" in the HTML element "kat_content"

然后您的表单/加载的网页应该有名为“event.theme”的新选择,因此以下代码不应再产生错误。

final HtmlSelect select = form.getSelectByName("event.theme");
final HtmlOption option = select.getOptionByText("Sport/Freizeit");
final Page newPage = select.setSelectedAttribute(option, false);
于 2012-05-30T20:36:58.940 回答