0

我正在尝试加载页面的动态内容以及静态 HTML。例如,在http://www.balsamiq.com/ ,如果我只加载 HTML,它将丢失页面底部的大推荐框。我知道我可以使用加载 html

html = open(url).read

但同样,这将丢失页面加载时显示的动态内容。如何获得与人类查看网站时所获得的内容相匹配的完整 HTML?谢谢!

4

2 回答 2

1

我通过使用Mechanize ruby​​ gem 并设置 user_agent 解决了我的问题。虽然不一定是我的问题的答案,但我将 user_agent 设置为搜索机器人,并且带有 javascript 的页面以不太动态的形式显示。

于 2012-06-12T18:15:50.577 回答
0

瓦蒂尔在这里也可能对您有所帮助。

于 2012-06-12T19:13:59.430 回答