我想使用 Hpricot 扫描inner_text
所有元素,并知道当前正在扫描什么元素。但是,我采用的每种方法都会导致递归。是否有使用 Hpricot(或 Nokogiri)执行此操作的内置函数?下面的代码只向下扫描一层:
@t = []
doc = Hpricot(open("some html doc"))
(doc/"html").each do |e|
e.children.each do |child|
if child.is_a?(Hpricot::Text)
@t << child.to_s.strip
end
end
end