2

我正在尝试在我的 rails 项目中使用 Nokogiri 从第三方读取 XML 文件。我无法解析的节点之一包含一个带有非转义 & 符号的 URL(如foo.com/index.html?page=1&query=bar

我知道这被认为是格式错误的 XML,并且 Nokogiri 无论如何都会尝试解析它,从而导致foo.com/index.html?page=1=bar.

如何获取完整的 URL?我可以调整 Nokogiri 吗?您会进行搜索和替换预运行还是最佳实践?

4

1 回答 1

2

在使用包含 & 符号的图像链接解析 SVG 时遇到了同样的问题。

将 SVG 解析为 HTML 似乎可以正确处理链接、转义 &。

fixed_svg = Nokogiri::HTML.fragment(raw_svg).to_html
# proceed with XML parsing
svg = Nokogiri::XML(fixed_svg)
于 2013-12-10T18:33:46.703 回答