0

使用nokogiri,

doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s

这可以完成工作,但是,它将所有内容都放在一个平面文本中。

我需要通过 html 标签获取每个文本

<b> text</b>
<h1>text3</b>

并将它们放入数组中。[“文本”,“文本 3”]

推荐的操作是什么?

我想过做

doc.xpath("*").text

但不知道如何遍历这一切。

4

1 回答 1

2
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_a
于 2009-10-03T07:18:47.890 回答