删除所有标签的更简单方法是Nokogiri::XML::DocumentFragment
只保留由空格分隔的文本?
我想改造:
Hello<br>My name is McOmghall
进入:
Hello My name is McOmghall
我的解决方案是:
Nokogiri::XML.fragment(html_text).children.to_a.flatten.select { |node| node.class == Nokogiri::XML::Text}
然后连接该数组,在每个元素之间放置空格,但我认为它不是最理想的而且不是很清楚。
编辑:
这是我的最终解决方案:
Nokogiri::XML.fragment(html_text).xpath('.//text()').map(&:text).join(' ')