0

我尝试使用以下内容加载页面内容:

HttpResponse response2 = HttpRequest.get(_PAGE_URL).cookies(response.cookies()).send();

在浏览器中,页面源代码充满了用于生成 DOM 的 javascript,但在浏览器的 Web Inspector 中我可以看到生成的源代码。

问题是,我可以通过 Jodd 的实用程序以某种方式检索生成的页面内容吗?

4

1 回答 1

0

你不能。您可以只下载静态 HTML 内容(正如您所做的那样),然后您需要使用其他工具来呈现它。

从 Java 8 开始,您可以使用 JavaFX 的 WebView 组件(据我所知),但也请搜索其他工具(也许cef?)

编辑参见:https ://github.com/igr/web-scraper (基于 Selenium WebDriver)。我想念的一件事是更好地控制请求/响应。

还有 HtmlUnit,但从评论来看,Selenium 似乎是一个更好的选择。

于 2022-01-13T11:09:01.157 回答