0

它是capybara通过HTTPS协议访问的页面上的图片标签:

<img src="path">

有什么方法可以使用带有任何类型的驱动程序的水豚从页面获取图像文件?

我不能使用像 File.read('path') 这样的东西,因为图像也只能通过 HTTPS 访问。我最近的研究让我找到了这样的解决方案:

  1. 访问页面
  2. 将页面保存为 png(webkit 驱动程序有这种有用的能力)
  3. 裁剪图像

但我确实相信存在漂亮的解决方案。

编辑1:

我已经尝试过 padde 的解决方案,但这里是响应正文:

<html><head><title>Object moved</title></head> 
    <body>
        <h2>Object moved to <a href=\"/Bledy/Blad404.aspx?aspxerrorpath=/CaptchaType.ashx\">here</a>.</h2> 
    </body>
</html>

编辑2:

> curl -I image_path

5860cf30abf5d5480
HTTP/1.1 302 Found
Cache-Control: private
Content-Length: 168
Content-Type: text/html; charset=utf-8
Location: /Bledy/Blad404.aspx?aspxerrorpath=/CaptchaType.ashx
Server: Microsoft-IIS/7.5
X-AspNet-Version: 4.0.30319
X-Powered-By: ASP.NET
Date: Sat, 03 Nov 2012 17:18:55 GMT
4

1 回答 1

2

如果我做对了,您可能想要的是来自 Ruby 的 HTTPS 请求。尝试:

require 'net/https'

url = URI.parse('path')

Net::HTTP.start(url.host, url.port, :use_ssl => true, :verify_mode => OpenSSL::SSL::VERIFY_NONE) do |http|
  res = http.get(url.request_uri)
  open("image.png", "wb") do |f|
    f.write(res.body)
  end
end

对于裁剪,您可以使用chunky_png(纯 Ruby)或rmagick(需要 ImageMagick)

编辑:如果你想跟随重定向,你可以做

require 'net/https'

def process_image( content )
  # do your cropping here

  open("image.png", "wb") do |f|
    f.write(content)
  end
end

def fetch( url )
  Net::HTTP.start(url.host, url.port, :use_ssl => true, :verify_mode => OpenSSL::SSL::VERIFY_NONE) do |http|
    response = http.get(url.request_uri)
    case response.code
    when Net::HTTPRedirection
      fetch response['location']
    else
      process_image response.body
    end
  end
end

fetch URI.parse('path')
于 2012-11-03T14:41:25.957 回答