Ruby 中是否有任何 HTML 解析器将 HTML 文档读入 DOM 树并将 HTML 标签表示为 DOM 元素?
我知道 Nokogiri,但它不会将 HTML 解析为 DOM 树。
Ruby 中是否有任何 HTML 解析器将 HTML 文档读入 DOM 树并将 HTML 标签表示为 DOM 元素?
我知道 Nokogiri,但它不会将 HTML 解析为 DOM 树。
尽管你这么说,Nokogiri 是要走的路:
doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')
它甚至可以解析无效的 HTML 并返回一个 DOM 树:
>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"