0

使用 HtmlUnit 我想下载一个 html 页面的源代码。我成功地做到了(见下面的代码)。

htmlContents = HtmlPageFetcher.fetchPage(
    "https://dbs-careers.dbs.com.sg/psc/careers/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL");
System.out.println(htmlContents);

现在对于同一个站点,我想下载下一页(第 2 页)但我没有下一页的网址(或者我应该说下一页也使用与上一页相同的网址)任何人都可以帮助对此?2、3、4等页面的内容怎么下载??????

4

2 回答 2

1

您将不得不使用 AJAX 来获取该页面。如果您知道它是什么,那么只需参考 HtmlUnit 文档并了解如何使用它。如果您不知道 AJAX 是什么(基于这个问题很可能),那么我建议您首先学习如何使用 AJAX,然后遵循 HtmlUnit 文档。

于 2013-06-11T15:55:05.387 回答
0

如何单击带有 htmlunit 的 javascript 按钮的可能重复项 ?

正如莫斯蒂所说,页面使用 AJAX 在页面之间导航。因此,您需要触发 javascript 函数来获取下一页结果。

您可以使用Clyde Lobo的答案

尝试将此插件用于 Firefox,它会记录您的操作并为其生成 HTMLUnit 代码。可能会有所帮助。 http://code.google.com/p/htmlunitscripter/ _

于 2013-08-16T14:01:31.297 回答