我正在尝试抓取一个网站,但我想要得到的东西不在源代码中。但是当我使用萤火虫时它确实出现了。有没有办法从萤火虫代码而不是源代码中抓取?
问问题
1890 次
2 回答
1
您所追求的可能是由 JavaScript 动态加载的(可能使用 Ajax)。要在浏览器之外以编程方式获取它,您必须渲染 JavaScript,这并不容易。不过,您应该能够在渲染后运行 Greasemonkey 脚本来抓取它。请参阅http://blog.nparashuram.com/2009/08/screen-scraping-with-javascript-firebug.html。
于 2012-06-08T02:53:49.233 回答
0
如果答案不在源代码中(可能是混淆、编码等),那么它可能是在加载了XmlHTTPRequest
. 您可以使用 Firebug 中的“网络”面板来查看页面加载了哪些其他数据,以及它为加载它们所做的请求。
(您可能必须启用网络面板,然后重新加载页面/重新开始)
于 2012-06-08T02:52:27.540 回答