ruby - 如何从 Nokogiri::HTML 获取标签名称和 CSS 类

Question

我一直在尝试用 Nokogiri解析这些HTML 文件。这是我使用的代码

require 'nokogiri'
doc = Nokogiri::HTML File.open('usc...html', 'r')
children = doc.css('body div')
children.each do |child|
    puts child.name
end

div即使它们几乎是整个p,h3和h4标签，也会打印所有子元素。有人可以解释为什么会这样吗？另外，如何从它们中获取 CSS 类？

score 1 · Accepted Answer

这：

doc.css('body div')

将选择页面上的每个 div。如果你想要你应该使用的每个元素：

doc.css('*')

您可以通过以下方式参加 CSS 课程child[:class]

1 回答 1