Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
使用nokogiri,
doc = Nokogiri::HTML(your_html) doc.xpath("//text()").to_s
这可以完成工作,但是,它将所有内容都放在一个平面文本中。
我需要通过 html 标签获取每个文本
<b> text</b> <h1>text3</b>
并将它们放入数组中。[“文本”,“文本 3”]
推荐的操作是什么?
我想过做
doc.xpath("*").text
但不知道如何遍历这一切。
doc = Nokogiri::HTML(your_html) doc.xpath("//text()").to_a