0

我正在使用机械化宝石。如何获取两个 div 标签之间的内容?

"<div class='a'></div>content<div class='a'></div>"

问题是,内容在<p>标签之间。

<div>

  <div class='a'>Content1</div>
  <p></p>
  <p></p>
  <p></p>
  <p></p>
  <div class='a'>Content2</div>
  <p></p>
  <p></p>
  <p></p>
  <p></p>
</div>
4

1 回答 1

-1

您可以Nokogiri在检索页面后使用它来解析页面:

m = Mechanize.new
result = m.get("http://google.com")

html = Nokogiri::HTML(result.body)
divs = html.xpath('//div').map { |div| div.content } # here you can do whatever is needed with the divs
                                                     # I've mapped their content into an array
于 2013-05-16T07:26:07.303 回答