我想从 Nokogiri NodeSet 中获取未转义的内部 html。有谁知道如何做到这一点?
问问题
2706 次
4 回答
4
有什么不合适的吗?
nodeset.inner_html
于 2009-11-24T15:37:57.553 回答
2
丝瓜宝在这里帮了我很多忙。
于 2012-05-25T22:26:45.283 回答
1
将节点包装在 CDATA 中:
def wrap_in_cdata(node)
# Using Nokogiri::XML::Node#content instead of #inner_html (which
# escapes HTML entities) so nested nodes will not work
node.inner_html = node.document.create_cdata(node.content)
node
end
Nokogiri::XML::Node#inner_html
转义 HTML 实体,除了 CDATA 部分。
fragment = Nokogiri::HTML.fragment "<div>Here is an unescaped string: <span>Turn left > right > straight & reach your destination.</span></div>"
puts fragment.inner_html
# <div>Here is an unescaped string: <span>Turn left > right > straight & reach your destination.</span></div>
fragment.xpath(".//span").each {|node| node.inner_html = node.document.create_cdata(node.content) }
fragment.inner_html
# <div>Here is an unescaped string: <span>Turn left > right > straight & reach your destination.</span>\n</div>
于 2014-02-27T10:12:09.630 回答
0
旧版本的 libxml2 可能会导致 Nokogiri 返回一些转义字符。我最近遇到了这个问题。
于 2010-05-04T13:59:28.547 回答