5

我有以下 XML 文档:

<samlp:LogoutRequest ID="123456789" Version="2.0" IssueInstant="200904051217">
  <saml:NameID>@NOT_USED@</saml:NameID>
  <samlp:SessionIndex>abcdefg</samlp:SessionIndex>
</samlp:LogoutRequest>

我想从中获取SessionIndex(即'abcdefg')的内容。我试过这个:

XPATH_QUERY = "LogoutRequest[@ID][@Version='2.0'][IssueInstant]/SessionIndex"
SAML_XMLNS  = 'urn:oasis:names:tc:SAML:2.0:assertion'
SAMLP_XMLNS = 'urn:oasis:names:tc:SAML:2.0:protocol'

require 'nokogiri'
doc = Nokogiri::XML(xml)
doc.xpath(XPATH_QUERY, 'saml' => SAML_XMLNS, 'samlp' => SAMLP_XMLNS)

但我收到以下错误:

Nokogiri::XML::SyntaxError: Namespace prefix samlp on LogoutRequest is not defined
Nokogiri::XML::SyntaxError: Namespace prefix saml on NameID is not defined
Nokogiri::XML::SyntaxError: Namespace prefix samlp on SessionIndex is not defined

我已经尝试将命名空间添加到 XPath 查询中,但这并没有改变任何东西。

为什么我不能让 Nokogiri 相信命名空间是有效的?

4

2 回答 2

11

我为您看到了两种不同的选择:

  1. 删除所有命名空间

    http://www.rubydoc.info/github/sparklemotion/nokogiri/Nokogiri/XML/Document#remove_namespaces%21-instance_method

    蛮力的做法。可能会导致存在命名空间冲突的问题。

  2. 使用 collect_namespaces

    http://www.rubydoc.info/github/sparklemotion/nokogiri/Nokogiri/XML/Document#collect_namespaces-instance_method

    一个更好的解决方案。您可以使用它一次来识别名称空间(例如在 irb 中)并对其进行硬编码。

    或者

    在运行时使用它,并将其作为第二个参数提供给https://www.rubydoc.info/github/sparklemotion/nokogiri/Nokogiri/XML/Searchable#xpath-instance_method

于 2010-08-20T18:30:48.220 回答
8

看起来本文档中的命名空间没有正确声明 -根节点上应该有xmlns:samlp和属性。xmlns:saml在这种情况下,Nokogiri 基本上会忽略名称空间(因为它无法将它们映射到 URI 或 URN),因此如果您删除它们,您的 XPath 就可以工作,即

doc.xpath(XPATH_QUERY)
于 2009-05-08T16:18:31.380 回答