0

我不想要源代码。我想要渲染的页面。这是一个重要的区别,我显然无法通过简单地搜索 Google 来做出区分。

有谁知道我如何从 URL 获取呈现的页面?

这需要在 Java 中完成,希望没有额外的库。

4

2 回答 2

0

另一种解决方案是使用HTMLUnit“无 GUI 的 JAVA 浏览器”。Google 建议生成基于 ajax 的网页的快照以使其可抓取。

于 2012-07-18T21:27:59.303 回答
0

您可以尝试使用包装 Web 浏览器的库,例如Berkelium。如果您在 Java 中需要它,Google 搜索为 Berkelium 生成了这个 Java 包装 API(我没有亲自尝试过)。

sites.google 有一个使用示例

于 2012-07-18T21:22:11.013 回答