0

如何在Restclient::Response模块生成的 HTML 中搜索单词?

$getresponse = RestClient.get (url)
html=$getadsresponse.body
puts html

我可以看到生成的 HTML,但是如何在该 HTML 中搜索单词?

4

1 回答 1

0

使用 HTML 解析器正确解释 HTML。将 Nokogiri 与 xpath 一起使用,例如:

doc = Nokogiri::HTML(html)
found = doc.xpath('//p[@title = "some word"]/a[contains(text(), "some word")]')
found.each do |node|
  puts node.text
end
于 2012-05-21T20:29:05.473 回答