2

我想找到所有具有 href 属性等于值“a”、“b”或“c”的锚元素

到目前为止,我所做的是:

values = ['a','b','c']
anchors = page.css('a')

anchors.each do |anchor|
  if values.include? anchor.attribute('href').value
    p "found it"
  end
end

有什么方法可以直接选择这些锚点,而不必稍后再逐一检查?

4

2 回答 2

2

CSS 允许我们请求多个不同的选择器:

require 'nokogiri'

html = <<EOT
<html>
  <body>
    <a href="a">a link</a>
    <a href="x">x link</a>
    <a href="b">b link</a>
    <a href="y">y link</a>
    <a href="c">c link</a>
  </body>  
</html>
EOT

doc = Nokogiri::HTML(html)
doc.search('*[href="a"], *[href="b"], *[href="c"]').each { |n| p n.to_html }

运行返回:

"<a href=\"a\">a link</a>"
"<a href=\"b\">b link</a>"
"<a href=\"c\">c link</a>"
于 2013-10-09T02:18:11.117 回答
0

使用 Nokogiri,您始终可以使用 xpath:

<!doctype html>
<html lang="en">
<head></head>
<body>
  This is <a href="http://b.com">a link</a>
  This is <a href="http://a.com">another link</a>
</body>
</html>


noko_page.xpath("//a[@href='http://a.com' or @href= 'http://b.com']")



=> [#<Nokogiri::XML::Element:0x3fc9360be368 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc9360bdcd8 name="href" value="http://b.com">] children=[#<Nokogiri::XML::Text:0x3fc93618e93c "a link">]>, #<Nokogiri::XML::Element:0x3fc93618dc08 name="a" attributes=[#<Nokogiri::XML::Attr:0x3fc93618d71c name="href" value="http://a.com">] children=[#<Nokogiri::XML::Text:0x3fc93618fd78 "another link">]>]
于 2013-10-08T22:04:11.147 回答