0

我正在使用 ruby​​ 使用 typhoeus 下载完整的网页,但它只下载 HTML,

   request = Typhoeus::Request.new(
             "www.example.com",
             method: :get,
             headers: { Accept: "text/html" }
    )

response.body 只返回 HTML,我可以添加任何格式来下载完整的网页及其通过 javascript 加载的数据吗?或者有没有其他方法可以获取数据?

4

1 回答 1

0

这不能在单个请求中完成。您需要解析 html 以找到所需的所有图像并下载它们

根据您对此进行的操作,您可能需要对页面上的其他资产(例如 css)执行相同操作

于 2016-08-23T07:44:48.120 回答