我正在从 Web 表单中收集一些 HTML 格式的内容。在保存此 HTML 内容之前,我想对其进行快速健全性检查,以确保它看起来格式正确(没有未闭合的标签,没有无效的标记)。
使用 Ruby 和/或任何流行的 gem,我可以检查一个 HTML 片段字符串,例如:
<p>foo</p><h1>Unclosed H1<p>bar</p>
并发现诸如未闭合h1
标签之类的东西?
我以为 Nokogiri 会在这里救我,但没有:
>> Nokogiri::HTML::DocumentFragment.parse("<p>foo</p><h1>Unclosed H1<p>bar</p>").errors
=> []