我试图下载一个似乎必须通过浏览器单击的文件。该站点使用一个表单,其中包含几个指向名为 downloadFile 的 javascript 函数的 href。在这个函数中,名为 poslimit 的元素是通过 document.getElementById 获得的:
function downloadFile(actionUrl, formId)
{
document.getElementById(formId).action=actionUrl;
document.getElementById(formId).submit();
}
HTML 源代码片段:
<form method="post" name="commandForm" action="position-limits" id="poslimit">
<div id="content">
<li><a href="javascript:downloadFile('position-limits?fileName=20130711&positionLimit=CURRENT_POSITION_LIMIT_', 'poslimit');" > July 11, 2013 </a></li>
因此,单击 href 中上面的链接代码会调用另一个文件中的 javascript:
我试过了:
WebClient webClient = new WebClient(BrowserVersion.CHROME_16);
HtmlPage page = webClient.getPage("http://www.theocc.com/webapps/position-limits");
HtmlForm elt = page.getHtmlElementById("poslimit");
elt.setAttribute("action", "position-limits?fileName=20130709&positionLimit=POSITIONLIMITCHANGE_");
InputStream is = elt.click().getWebResponse().getContentAsStream();
int b = 0;
while ((b = is.read()) != -1)
{
System.out.print((char)b);
}
webClient.closeAllWindows();
还尝试使用 HtmlElement 我也尝试过:
WebClient webClient = new WebClient(BrowserVersion.CHROME_16);
HtmlPage page = webClient.getPage("http://www.theocc.com/webapps/position-limits");
ScriptResult sr = page.executeJavaScript("downloadFile('position-limits?fileName=20130709&positionLimit=POSITIONLIMITCHANGE_', 'poslimit'");
InputStream is = sr.getNewPage().getWebResponse().getContentAsStream();
int b = 0;
while ((b = is.read()) != -1)
{
System.out.print((char)b);
}
webClient.closeAllWindows();
这两个都来自这个和其他板上的示例,但我继续只取回原始页面而不是附件。我还想知道是否需要查看历史以获取正确的页面响应,因为我需要的返回窗口/文档可能是前一个。感谢提供完整解释或良好示例文档以及我可以尝试的来源的礼貌链接。