我一直在尝试用 Nokogiri解析这些HTML 文件。这是我使用的代码
require 'nokogiri'
doc = Nokogiri::HTML File.open('usc...html', 'r')
children = doc.css('body div')
children.each do |child|
puts child.name
end
div
即使它们几乎是整个p
,h3
和h4
标签,也会打印所有子元素。有人可以解释为什么会这样吗?另外,如何从它们中获取 CSS 类?