3

Ruby 中是否有任何 HTML 解析器将 HTML 文档读入 DOM 树并将 HTML 标签表示为 DOM 元素?

我知道 Nokogiri,但它不会将 HTML 解析为 DOM 树。

4

1 回答 1

6

尽管你这么说,Nokogiri 是要走的路:

doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')

它甚至可以解析无效的 HTML 并返回一个 DOM 树:

>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"
于 2012-12-09T21:54:25.977 回答