7

我正在使用 Mechanize 和 Nokogiri 来收集一些数据。我需要保存在每个请求中随机生成的图片。

在我的尝试中,我被迫下载所有图片,但我真正想要的唯一一张是位于div#specific.

此外,是否可以从中生成 Base64 数据,而无需保存或重新加载其源?

require 'rubygems'
require 'mechanize'
require 'nokogiri'

a = Mechanize.new { |agent|
    agent.keep_alive = true
    agent.max_history = 0
}

urls = Array.new()
urls.push('http://www.domain.com');

urls.each {|url|

    page = a.get(url)
    doc = Nokogiri::HTML(page.body)

    if doc.at_css('#specific')

        page.images.each do |img|
          img.fetch.save('picture.png')
        end

    end
}
4

1 回答 1

26

要从特定位置获取图像:

agent = Mechanize.new
page = agent.get('http://www.domain.com')
images = page.search("#specific img")

要保存图像:

agent.get(images.first.attributes["src"]).save "path/to/folder/image_name.jpg"

要在不保存的情况下对图像进行编码:

encoded_image = Base64.encode64 agent.get(images.first.attributes["src"]).body_io.string

我运行它只是为了确保可以将编码的图像解码回来:

File.open("images/image_name.jpg", "wb") {|f| f.write(Base64.decode64(encoded_image))}
于 2013-02-13T21:13:30.670 回答