1

Google 今天似乎让我失望了:我正在寻找一种将远程 html 页面加载到我的 Java 应用程序中的方法。此 HTML 页面包含一些生成大部分内容的 JavaScript。现在我认为用 Java 打开页面并查看 HTML 会相当简单。

当我使用 URL.openStream() 读取文件时,我得到了带有 JavaScript 的 HTML 源代码,而没有生成的 HTML(这是我所期望的)。那么我如何从这个获取包含生成内容的 HTML 源?我认为这会相当简单,但在 Google 上几个小时后,我完全陷入了 Rhino、EnvJs、Jsoup 中,但这并没有真正让我有任何收获。

有没有人有什么建议?

4

1 回答 1

2

是的,基本上没有简单的解决方案,因为您需要实际呈现页面,所以您需要一个 javascript 引擎(如feeela 所说)。

一种解决方案是使用 webkit。我没有在 Java 中使用它,而是在 Python 中使用它。您可以在多个平台上查看 Java 应用程序中的 WebKit 浏览器

于 2012-10-23T13:08:20.887 回答