3

在 Ruby 类中,我想解析并获取保存在数据库中的某些文本中第一次出现的图像。特别是,我想收集所有src属性。

Nokogiri 会帮助我吗?我该怎么做?


编辑1:

我写:

// database stuff...
doc = Nokogiri::HTML(my_html)

doc.search('img') do |img_tag|
  puts img_tag
end

但我无法收集图像标签。


编辑2:

我找到了解决方案:

doc.search('img').each do |img_tag|
  puts img_tag.attributes['src']
end
4

2 回答 2

9

试试这个:

require 'nokogiri'

str = "some text <img src='/some/path' /> some another text"
doc = Nokogiri::HTML(str)
if img = doc.xpath('//img').first
    p img.attr('src')
end

在此处查看现场演示

于 2012-10-09T14:30:42.807 回答
2

doc.xpath('//img').first.attr('src').text

于 2012-10-09T14:45:09.763 回答