如果我有一堆元素,例如:
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
Nokogiri 中是否有内置方法可以让我获取p
包含文本“Apple”的所有元素?(例如,上面的示例元素将匹配)。
Nokogiri 可以使用 jQuery 对 CSS 的扩展来做到这一点(现在):
require 'nokogiri'
html = '
<html>
<body>
<p>foo</p>
<p>bar</p>
</body>
</html>
'
doc = Nokogiri::HTML(html)
doc.at('p:contains("bar")').text.strip
=> "bar"
这是一个有效的 XPath:
require 'nokogiri'
doc = Nokogiri::HTML(DATA)
p doc.xpath('//li[contains(text(), "Apple")]')
__END__
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
尝试使用这个 XPath:
p = doc.xpath('//p[//*[contains(text(), "Apple")]]')
您也可以使用Nikkou轻松完成此操作:
doc.search('p').text_includes('bar')