我正在尝试在我的 rails 项目中使用 Nokogiri 从第三方读取 XML 文件。我无法解析的节点之一包含一个带有非转义 & 符号的 URL(如foo.com/index.html?page=1&query=bar
)
我知道这被认为是格式错误的 XML,并且 Nokogiri 无论如何都会尝试解析它,从而导致foo.com/index.html?page=1=bar
.
如何获取完整的 URL?我可以调整 Nokogiri 吗?您会进行搜索和替换预运行还是最佳实践?
我正在尝试在我的 rails 项目中使用 Nokogiri 从第三方读取 XML 文件。我无法解析的节点之一包含一个带有非转义 & 符号的 URL(如foo.com/index.html?page=1&query=bar
)
我知道这被认为是格式错误的 XML,并且 Nokogiri 无论如何都会尝试解析它,从而导致foo.com/index.html?page=1=bar
.
如何获取完整的 URL?我可以调整 Nokogiri 吗?您会进行搜索和替换预运行还是最佳实践?