htmlunit - 如何使用 HtmlUnit 下载网页的 Html 内容/源

Question

使用 HtmlUnit 我想下载一个 html 页面的源代码。我成功地做到了（见下面的代码）。

htmlContents = HtmlPageFetcher.fetchPage(
    "https://dbs-careers.dbs.com.sg/psc/careers/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL");
System.out.println(htmlContents);

现在对于同一个站点，我想下载下一页（第 2 页）但我没有下一页的网址（或者我应该说下一页也使用与上一页相同的网址）任何人都可以帮助对此？2、3、4等页面的内容怎么下载？？？？？？

score 1 · Accepted Answer

您将不得不使用 AJAX 来获取该页面。如果您知道它是什么，那么只需参考 HtmlUnit 文档并了解如何使用它。如果您不知道 AJAX 是什么（基于这个问题很可能），那么我建议您首先学习如何使用 AJAX，然后遵循 HtmlUnit 文档。

score 0 · Accepted Answer

如何单击带有 htmlunit 的 javascript 按钮的可能重复项？

正如莫斯蒂所说，页面使用 AJAX 在页面之间导航。因此，您需要触发 javascript 函数来获取下一页结果。

您可以使用Clyde Lobo的答案

尝试将此插件用于 Firefox，它会记录您的操作并为其生成 HTMLUnit 代码。可能会有所帮助。 http://code.google.com/p/htmlunitscripter/ _

htmlunit - 如何使用 HtmlUnit 下载网页的 Html 内容/源

2 回答 2

Related

Reference